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内 容 简介 

本 书 采 取 “ 基 础 知识 核心 技术 一 核心 应 用 -高 级 应 用 -项 目 实践 ”结构 和 “由 浅 入 深 ， 由 深 到 精 ”的 模式 进行 讲解 。 
全 书 共 5 篇 23 章 。 首 先 讲解 Python 快速 入 门 ，Python 编程 基础 ， 数 字 和 字符 串 类 型 ，Python 列表 、 元 组 与 字典 等 ; 
深入 讲解 了 如 何 使 用 Python 字符 串 及 运算 符 ， 控 制 流程 和 控制 语句 ， 函 数 ， 文 件 与 文件 目录 ， 数 据 格式 化 ，Python 类 
的 使 用 ，Python 模块 的 使 用 等 ， 详 细 讲 解 了 如 何 用 Pillow 库 处 理 图 片 ， 正 则 表达 式 ，Python 线程 和 进程 ，Python 异常 
处 理 , 程序 测试 与 打包 , 数据 结构 基础 , 数据库 编程 等 ;然后 介绍 了 网 络 编程 ,Web 网 站 编程 技术 ,基于 tkinter 的 GUI 
界面 编程 以 及 其 他 高 级 技术 等 ， 在 实践 环节 讲解 了 游戏 开发 飞机 大 战 和 网 上 购物 系统 两 个 实战 案例 ， 介 绍 了 完整 的 
了 Python 系统 开发 流程 。 全 书 不 仅 融入 了 作者 丰富 的 工作 经 验 和 多 年 使 用 Python 的 心得 ， 还 提供 了 大 量 实例 ， 具 有 较 
强 的 实战 性 和 可 操作 性 。 

本 书 虽 在 从 多 角度 、 全 方位 帮助 读者 快速 掌握 软件 开发 技能 ， 构 建 从 高 校 到 社会 的 就 职 桥梁 ， 让 有 志 于 从 事 软 件 
开发 的 读者 轻松 步 入 职场 。 另 外 ， 本 书 还 赠送 大 量 资源 ， 由 于 赠送 的 资源 比较 多 ， 我 们 在 本 书 前 言 部 分 做 了 详细 说 明 。 

本 书 适合 Python 入 门 者 ,也 适合 Python 数据 库 管 理 员 以 及 想 全 面 学 习 Python 数据 库 技术 以 提升 实战 技能 的 人 员 阅 读 ， 
还 可 作为 正在 进行 软件 专业 毕业 设计 的 学 生 以 及 大 专 院 校 和 培训 学 校 的 参考 用 书 。 
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PREFACE 吾 


丛书 说 明 


本 套 “ 软 件 开发 魔 典 ” 系 列 图 书 ， 是 专门 为 编程 初学 者 量 身 打造 的 编程 基础 学 习 与 项 目 实践 用 书 。 

本 套 从 书 针对 “ 零 基础 ”和 “入 门 ”级 读者 ， 通 过 案例 引导 读者 深入 技能 学 习 和 项 目 实践 。 为 满足 初 
学 者 在 基础 入 门 、 扩 展 学 习 、 编 程 技 能 、 行 业 应 用 、 项 目 实战 五 个 方面 的 职业 技能 需求 。 特 意 采 用 “基础 
知识 一 核心 技术 一 核心 应 用 一 高 级 应 用 一 项 目 实践 ”结构 和 “由 浅 入 深 ， 由 深 到 精 ”的 模式 进行 讲解 。 


Python 最 佳 学 习 模 式 


本 书 以 Python 最 佳 的 学 习 模 式 来 分 配 内 容 结构 ， 第 1 一 4 篇 可 帮助 读者 掌握 Python 基础 知识 、 应 
用 技能 ， 第 5 篇 可 帮助 读者 积累 多 个 行业 项 目 开发 经 验 。 读者 如 果 遇 到 问题 ,可 扫 码 观看 本 书 同步 微 视频 ， 
也 可 以 通过 在 线 技术 支持 让 老 程序 员 答疑 解 惑 。 


本 书 内 容 


全 书 共 分 为 5 篇 23 章 。 

第 1 篇 (第 1~4 章 ) 为 基础 知识 ， 主 要 讲解 Python 的 基础 知识 ，Python 编程 基础 ， 数 字 和 字符 串 类 
型 ，Python 列表 、 元 组 与 字典 等 。 读 者 在 学 完 本 篇 后 ， 将 会 熟悉 Python 的 基本 概念 ， 掌 握 Python 的 基本 
操作 及 应 用 方法 ， 为 后 面 更 好 地 学 习 Python 编程 打 好 基础 。 

第 2 篇 (第 5~11 章 ) 为 核心 技术 ， 主 要 讲解 程序 中 如 何 使 用 字符 串 及 运算 符 ， 程 序 的 控制 结构 ， 函 
数 , 文件 与 文件 目录 ,数据 格式 化 ，Python 类， 模块 等 。 通 过 本 篇 的 学 习 ， 读 者 将 对 使 用 Python 进行 基 
础 编程 有 了 一 定 的 了 解 。 

第 3 篇 (第 12 一 18 章 ) 为 核心 应 用 ,主要 讲解 用 Pillow 库 处 理 图 片 ， 正则 表达 式 ，Python 线程 和 进程 ， 
了 Python 异常 处 理 ， 程 序 测试 与 打包 ， 数 据 结构 基础 ， 数 据 库 编程 等 。 学 完 本 篇 ， 读 者 将 对 Python 管理 、 操 
作 以 及 使 用 Python 进行 综合 性 应 用 有 了 一 定 的 了 解 。 

第 4 篇 (第 19~21 章 ) 为 高 级 应 用 ， 主 要 讲解 Python 网 络 编程 ，Web 网 站 编程 ， 基 于 tkinter 的 GUI 
界面 编程 等 。 学 好 本 篇 内 容 读者 可 以 进一步 提高 运用 Python 进行 网 络 编 程 和 GUI 界面 编程 的 能 力 。 

第 5 篇 (第 22~23 章 ) 为 项 目 实践 ， 通 过 游戏 开发 飞机 大 战 和 网 上 购物 系统 两 个 实战 案例 ， 介 绍 了 完 
整 的 Python 项 目 开发 流程 。 通过 本 篇 的 学 习 , 读者 将 对 Python 编程 在 项 目 开发 中 的 实际 应 用 拥有 切身 的 体 
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会 ， 为 日 后 进行 软件 开发 积累 下 项 目 管理 及 实践 开发 经 验 。 

全 书 不 仅 融入 了 作者 丰富 的 工作 经 验 和 多 年 使 用 Python 的 心得 ， 还 提供 了 大 量 实例 ， 具 有 较 强 的 实战 
性 和 可 操作 性 。 系统 学 习 本 书后 读者 可 以 掌握 Python 基础 知识 ,具备 全 面 的 Python 编程 能 力 、 优 良 的 团队 
协同 技能 和 丰富 的 项 目 实战 经 验 。 编 写本 书 的 目标 就 是 让 初学 者 、 应 届 毕 业 生 快 速成 长 为 一 名 合格 的 初级 
程序 员 ， 通 过 演练 积累 项 目 开发 经 验 和 团队 合作 技能 ， 在 未 来 的 职场 中 获取 一 个 高 的 起 点 ， 并 能 迅速 融入 
软件 开发 团队 中 。 


本 书 特色 


1. 结构 科学 、 易 于 自学 
本 书 在 内 容 组 织 和 范例 设计 中 都 充分 考虑 了 初学 者 的 特点 ， 讲 解 由 浅 入 深 ， 循 序 渐进 。 无 论 读者 是 否 
接触 过 Python， 都 能 从 本 书 中 找到 最 佳 的 起 点 。 


2. 视频 讲解 、 细 致 透彻 
为 降低 学 习 难 度 ， 提 高 学 习 效 率 ， 本 书 录制 了 同步 微 视频 (模拟 培训 班 模式 )， 通 过 视频 学 习 ， 除 了 能 
轻松 学 会 专业 知识 外 ， 还 能 获取 老师 的 软件 开发 经 验 ， 学 习 变 得 更 轻松 有 效 。 


3. 超 多 、 实 用 、 专 业 的 范例 和 实战 项 目 


本 书 结合 实际 工作 中 的 应 用 范例 ， 逐 一 讲解 Python 的 各 种 知识 和 技术 ， 在 项 目 实践 篇 中 更 以 两 个 项 目 
实践 来 总 结 、 贯 通 本 书 所 学 ， 使 读者 在 实践 中 掌握 知识 ， 轻 松 拥 有 项 目 开发 经 验 。 


4. 随时 检测 自己 的 学 习 成 果 

每 章 首页 均 提供 了 “学 习 指 引 ” 和 “重点 导读 ”， 以 指导 读者 重点 学 习 及 学 后 检查 ， 每 章 后 的 “就 业 
面试 技巧 与 解析 ”根据 当前 最 新 求职 面试 (笔试 ) 精 选 而 成 ， 读 者 可 以 随时 检测 自己 的 学 习 成 果 ， 做 到 融 
会 员 通 。 

5. 专业 创作 团队 和 技术 支持 

本 书 由 聚 慕 课 教育 研发 中 心 编著 和 提供 在 线 服 务 。 读 者 在 学 习 过 程 中 遇 到 任何 问题 ， 均 可 登录 
www.jumooc.com 网 站 或 加 入 读者 (技术 支持 ) 服务 QQ 群 (529669132)， 进 行 提问 ， 作 者 和 资深 程序 员 会 
为 读者 在 线 答疑 。 


本 书 附 赠 超 值 王牌 资源 库 


本 书 附 赠 了 以 下 极为 丰富 、 超 值 的 王牌 资源 库 。 

(1) 王牌 资源 1: 随 赠 本 书 “ 配 套 学 习 与 教学 ”资源 库 ， 提 升 读者 学 习 Python 的 效率 。 

。 本 书 同步 293 节 教 学 微 视频 录像 (支持 扫描 二 维 码 观看 )， 总 时 长 35 学 时 。 

。 本 书 中 两 个 大 型 项 目 案 例 以 及 本 书 实例 源 代码 。 

。 本 书 配套 上 机 实 训 指导 手册 及 本 书 教学 PPT 课件 。 

(2) 王牌 资源 2， 随 赠 “职业 成 长 ”资源 库 ， 突 破 读者 职业 规划 与 发 展 瓶颈 。 

。 求职 资源 库 .100 套 求职 简历 模板 库 、600 套 毕 业 答辩 与 80 套 学 术 开题 报告 PPT 模板 库 。 

。 面试 资源 库 : 程序 员 面 试 技巧 、400 道 求职 常见 面试 (笔试 ) 真题 与 解析 。 

。 职业 资源 库 : 程序 员 职业 规划 手册 、 软 件 工 程 师 技能 手册 、100 例 常见 错误 及 解决 方案 、 开 发 经 验 


及 技巧 集 、100 套 岗位 竞聘 模板 。 

(3) 王牌 资源 3: 随 赠 “Python 软件 开发 魔 典 ”资源 库 ， 拓 展 读者 学 习 本 书 的 深度 和 广度 。 

。 案例 资源 库 ，100 个 实例 及 源码 注释 。 

。 项 目 资源 库 : 5 个 项 目 开 发 策划 案 。 

。 程序 员 测 试 资源 库 : 计算 机 应 用 测试 题库 、 编 程 基础 测试 题库 、 编 程 逻辑 思维 测试 题库 、 编 程 英 语 
水 平 测试 题库 。 

。 软件 开发 文档 模板 库 : 10 套 八 大 行业 软件 开发 文档 模板 库 、40 套 Python 项 目 案例 库 。 

。 软件 学 习 及 电子 书 资源 库 : Python 标准 库 查询 手册 电子 书 、Python 常见 函数 查询 手册 电子 书 、 
Python 关键 字 速 查 手册 电子 书 、Python 语法 速 查 手册 电子 书 、Python 模块 速 查 手册 电子 书 、Python 
疑难 问题 速 查 手册 电子 书 。 

(4) 王牌 资源 4: 编程 代码 优化 纠 错 器 。 

。 本 纠 错 器 能 让 软件 开发 更 加 便捷 和 轻松 ， 无 须 安装 配置 复杂 的 软件 运行 环境 即 可 轻松 运行 程序 代码 。 

。 本 纠 错 器 能 一 键 格式 化 ， 让 凌乱 的 程序 代码 更 加 规整 美观 。 

。 本 纠 错 器 能 对 代码 精准 纠 错 ， 让 程序 查 错 不 再 困难 。 


资源 获取 及 使 用 方法 
注意 : 由 于 本 书 不 配送 光盘 ， 因 此 书 中 所 用 及 上 述 资源 均 须 借助 网 络 下 载 才能 使 用 。 
1. 资源 获取 


采用 以 下 任意 途径 ， 均 可 获取 本 书 所 附 赠 的 超 值 王牌 资源 库 。 

(1) 加 入 本 书 微 信 公众 号 “ 聚 慕 课 jumooc” 或 QQ 群 ， 下 载 资源 或 者 咨询 关于 本 书 的 任何 问题 。 

(2) 登录 网 站 www.jumooc.com， 搜 索 本 书 并 下 载 对 应 资源 。 本 

(3) 加 入 本 书 读者 〈 技 术 支持 ) 服务 QQ 群 (529669132)， 读 者 可 以 打开 群 “ 文 件 ” 中 对 应 的 word 文 qq 服务 群 
件 ， 获 取 网 络 下 载 地 址 和 密码 。 

(4) 通过 电子 邮件 ，zhangmin2@tup.tsinghua.edu.cn 与 我 们 联系 ， 获 取 本 书 相应 资源 。 


2. 使 用 资源 

读者 可 通过 以 下 途径 学 习 和 使 用 本 书 微 视频 和 资源 。 

(1) 通过 计算 机 、 手 机 App 和 微 信 学 习 本 书 微 视频 。 

(2) 将 本 书 资源 下 载 到 本 地 硬盘 ， 根 据 学 习 需 要 选择 性 使 用 。 


本 书 适合 哪些 读者 阅读 


本 书 非常 适合 以 下 人 员 阅 读 。 

。 没有 任何 Python 基础 的 初学 者 。 

。 有 一 定 的 Python 基础 ， 想 精通 Python 编程 的 人 员 。 
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只 有 具备 了 牢固 的 基础 知识 ， 才 能 更 快 地 掌握 高 级 的 技术 。 本 篇 内 容 为 Python 快速 入 门 ， 通 过 
对 Python 编程 基础 、Python 数据 类 型 、Python 列表 、 元 组 与 字典 等 知识 的 讲解 ， 为 读者 以 后 更 深入 地 
学 习 Python 奠定 扎实 的 基础 。 


第 1 章 Python 快速 入 门 

第 2 章 Python 编程 基础 

第 3 章 数字 和 字符 串 类 型 

第 4 章 Python 列表 、 元 组 与 字典 


第 1 章 
Python 快速 入 门 


EP 学 习 指引 


当下 无 论 是 大 数据 、 人 工 智 能 还 是 机 器 学 习 ，Python 都 是 最 热门 的 首选 语言 。 本 章 具 体 讲 解 Python 语 
言 的 由 来 、 优 缺点 、 应 用 领域 以 及 发 展 ，Python 开发 环境 配置 、 运 行 等 内 容 ， 最 后 讲述 Python 解释 器 和 集 
成 开发 环境 以 及 程序 运行 流程 ， 为 读者 后 续 学 习 打 下 坚实 基础 。 


二 重点 导读 


。 了 解 Python 语言 基础 知识 。 
“掌握 Python 程序 开发 环境 的 建立 。 
“熟悉 Python 解释 器 与 集成 开发 环境 的 使 用 。 


1.1 走 进 Python 语言 


欢迎 来 到 Python 的 “编程 ” 世界， 很 荣幸 您 能 选择 本 书 作 为 开启 Python 编程 世界 大 门 的 钥匙 。Python 
是 一 种 优雅 而 健壮 的 编程 语言 ， 崇 尚 优美 、 明 确 、 简 单 ， 是 一 种 优秀 并 广泛 使 用 的 语言 ， 它 继承 了 传统 编 
译 语言 的 强大 性 和 通用 性 ， 同 时 也 借鉴 了 简单 脚本 和 解 
释 语言 的 易 用 性 。 它 可 以 帮 您 完成 任意 想 完 成 的 工作 ， 
只 有 想不到 ， 没 有 Python 做 不 到 。 

Python 的 创始 人 为 吉 多 。 范 罗 苏 姆 〈Guido van 
Rossum)， 人 称 “ 旬 叔 ” 于 1989 年 年 底 发 明 Python， 
第 一 个 公开 发 行 版 发 行 于 1991 年 . 像 Perl 语言 一 样 ,Python 
源 代码 同样 遵循 GPL (GNU General Public License, GNU 
通用 公共 授权 协议 )， 如 图 1-1 所 示 。 

了 Python 作为 一 门 高 级 编程 语言 , 它 的 诞生 虽然 很 偶然 , 但 是 它 得 到 程序 员 的 喜爱 却 是 必然 之 路 。“ 龟 叔 ” 
给 Python 的 定位 是 “优雅 ”“ 明 确 ”“ 简 单 ”， 所 以 Python 程序 看 上 去 非常 简单 易 懂 , 初学 者 学 Python 语言 ， 
不 但 入 门 容 易 ， 如 果 深 入 地 研究 下 去 ， 可 以 轻松 编写 出 非常 复杂 和 功能 强大 的 程序 。 


1-1 Python 语言 创始 人 


第 国 章 Python 快速 入 门 


Python 的 设计 具有 很 强 的 可 读 性 ， 相 比 其 他 语言 经 常 使 用 英文 关键 字 、 上 其 
具有 比 其 他 语言 更 有 特色 的 语法 结构 。 

。 Python 是 一 种 解释 型 语言 : 这 意味 着 开发 过 程 中 没有 了 编译 这 个 环节 。 

e Python 是 交互 式 语言 : 


他 语言 的 一 些 标点 符号 ， 它 


类 似 于 PHP 和 Perl 语言 。 


意味 着 可 以 在 一 个 Python 提示 符 下 直接 互动 执行 编写 程序 。 


。 Python 是 面向 对 象 语言 ， 这 意味 着 Python 支持 面向 对 象 的 风格 或 代码 封装 在 对 象 的 编程 技术 。 


。 Python 是 初学 者 的 语言 : Python 对 初级 程序 员 而 言 , 是 一 种 伟大 的 语言 ， 
从 简单 的 文字 处 理 到 WWW 浏览 器 再 到 游戏 。 


Python 语言 的 前 世 今 生 


友人 4 


它 支持 广泛 的 应 用 程序 开发 ， 


1989 年 ,为 了 打发 圣诞 节 假 期 ，Guido 开始 编写 Python 语言 的 编译 器 。Python 这 个 名 字 来 自 Guido 所 
挚爱 的 电视 剧 Monty Python's Flying Cireus。 他 希望 这 种 新 的 语言 叫 作 Python 语言 ， 能 符合 他 的 理想 : 创造 


一 种 C 和 Shell 之 间 ， 功 能 全 面 ， 易 学 易 用 ， 可 拓展 的 语言 。 


1991 年 ， 第 一 个 Python 编译 器 诞生 。 它 是 用 C 语言 实现 的 ， 并 能 够 调用 C 语言 的 库 文件 。 从 一 开始 ， 


Python 就 已 经 具有 了 类 、 函 数 、 异 常 处 理 、 包 含 表 和 词典 在 内 的 核心 数据 类 型 以 及 模块 等 为 基础 的 拓 


展 系 


统 。 当 前 Python 的 最 新 版 本 为 3.6。Python 语言 的 版 本 中 2.X 和 3.X 是 个 较 大 的 跳跃 和 隔离 ， 它 突破 了 大 
多 数 软件 向 低 版 本 兼容 的 特性 。3.X 版 本 不 再 兼容 2.X 版 本 程序 , 并 且 有 了 较 大 的 改动 ， 是 一 次 里 程 碑 的 跳 


跃 。Python 版 本 演进 如 表 1-1 所 示 。 
表 1-1 Python 软件 版 本 发 布 年 代 


1.1.2 Python 语言 的 优 缺 点 


Python 2.7 


2009 年 6 月 27 日 发 布 
2011 年 2 月 20 日 发 布 
2012 年 9 月 29 日 发 布 
2014 年 3 月 16 日 发 布 
2015 年 9 月 13 日 发 布 
2016 年 12 月 23 日 发 布 
预计 2018 年 6 月 15 日 发 布 


通过 上 面 的 介绍 ， 可 以 了 解 到 Python 是 一 种 动态 解释 性 的 语言 。 那 么 这 种 语言 具有 哪些 优 缺 点 呢 ? 


1. Python 语言 的 优点 
了 Python 语言 具有 如 下 优点 。 
1) 易学 


Python 的 定位 是 “优雅 ”“ 明 确 ”“ 简 单 ” 所 以 Python 程序 看 上 去 总 是 简单 易 懂 ， 初 学 者 学 Python， 


不 但 入 门 容易 ， 而 且 将 来 深入 下 
2) 开发 效率 高 
了 Python 有 非常 强大 的 第 三 方 库 ， 基 本 上 用 户 想 通 过 计算 机 实现 的 任何 功能 ， 


， 可 以 编写 非常 复杂 的 程序 。 


Python 官方 库 里 都 有 相应 的 
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模块 进行 支持 ， 直 接 下 载 调用 后 ， 在 基础 库 的 基础 上 再 进行 开发 ， 可 大 大 降低 开发 周期 ， 避 人 免 重 复 造 轮子 。 
3) 高 级 语言 
使 用 Python 语言 编写 程序 的 时 候 ， 无 须 考虑 诸如 如 何 管理 程序 使 用 内 存 一 类 的 底层 细节 。 
4) 可 移植 性 
由 于 Python 的 开源 本 质 ，Python 已 经 被 移植 在 许多 平台 上 经 过 改动 使 它 能 够 工作 在 不 同 平台 上 )。 
如 果 避 免 使 用 依赖 于 系统 的 特性 ， 那 么 所 有 Python 程序 无 须 修改 就 几乎 可 以 在 市 场 上 所 有 的 系统 平台 上 


运行 。 


5) 可 扩展 性 

如 果 需 要 一 段 关键 代码 运行 得 更 快 或 者 希望 某 些 算法 不 公开 ， 可 以 把 部 分 程序 用 C 或 C++ 编写 ， 然 后 
在 Python 程序 中 使 用 它们 。 

6) 可 嵌入 性 


可 以 把 Python 嵌入 C/C++ 程序 中 ， 从 而 向 程序 用 户 提 供 脚 本 功能 。 

2. Python 语言 的 缺点 

了 Python 语言 具有 如 下 缺点 。 

1) 速度 慢 

了 Python 的 运行 速度 相 比 C 语言 确实 慢 很 多 ， 跟 Java 相 比 也 要 慢 一 些 。 其 实 这 里 所 指 的 运行 速度 慢 , 在 
大 多 数 情况 下 用 户 是 无 法 直接 感知 到 的 ， 必 须 借助 测试 工具 才能 体现 出 来 。 例 如 用 C 运行 一 个 程序 花 了 
0.01s， 用 Python 是 0.1s， 这 样 C 语言 直接 比 Python 快 了 10 倍 ， 算 是 非常 夸张 了 ， 但 是 人 们 是 无 法 直接 通 
过 肉眼 感知 的 。 其 实在 大 多 数 情况 下 ，Python 已 经 完全 可 以 满足 人 们 对 程序 速度 的 要 求 ， 除 非 要 写 对 速度 
要 求 极 高 的 搜索 引擎 等 ， 在 这 种 情况 下 ， 当 然 还 是 建议 用 C 去 实现 。 

2) 代码 不 能 加 密 
为 Python 是 解释 型 语言 ， 它 的 源码 都 是 以 明文 形式 存放 的 ， 不 过 这 并 不 算是 一 个 缺点 ， 如 果 项 目 要 
求 源 代码 必须 是 加 密 的 ， 那 一 开始 就 不 应 该 用 Python 去 实现 。 

3) 线程 不 能 利用 多 CPU 问题 

这 是 Python 被 人 们 诉 病 最 多 的 一 个 缺点 ，GIL (Global Interpreter Lock， 全 局 解释 器 锁 ) 是 计算 机 程序 
设计 语言 解释 器 用 于 同步 线程 的 工具 ， 使 得 任何 时 刻 仅 有 一 个 线程 在 执行 。Python 的 线程 是 操作 系统 的 原 
生 线 程 , 在 Linux 上 为 Pthread, 在 Windows 上 为 Win thread, 完全 由 操作 系统 调度 线程 的 执行 。 一 个 Python 
解释 器 进程 内 有 一 条 主线 程 ， 以 及 多 条 用 户 程序 的 执行 线程 。 即 使 在 多 核 CPU 平台 上 ， 由 于 GIL 的 存在 ， 
所 以 禁止 多 线程 的 并 行 执行 。 


1.1.3 ”Python 语言 的 应 用 领域 


Python 越 来 越 受 欢 迎 ， 用 户 数 量 每 年 都 大 幅度 增长 的 原因 在 于 Python 逐渐 成 为 所 有 IT 技术 的 首选 语 
言 。 几 乎 所 有 的 IT 领域, 包括 Web 研发 、 云 计算 (AWS、OpenStack、VMware、Google 云 、Oracle 云 等 )、 
基础 设施 自动 化 、 软 件 测试 、 移 动 端 测试 、 大 数据 和 Hadoop、 数 据 科学 等 ， 都 将 Python 作为 首选 编程 语 
言 。 像 神经 网 络 、 智 能 算法 、 数 据 分 析 、 图 像 处 理 、 科 学 计算 等 更 需要 金字 塔 式 项 湖人 才 ! 目前 Python 的 
主要 应 用 领域 如 图 1-2 所 示 。 

了 Python 可 以 应 用 于 众多 领域 ， 如 数据 分 析 、 组 件 集成 、 网 络 服务 、 图 像 处 理 、 数 值 计算 和 科学 计算 等 。 
目前 ， 业 内 几乎 所 有 大 中 型 互联 网 企业 都 在 使 用 Python， 如 YouTube、Dropbox、BT、Quora、 豆 辩 、 知 乎 、 
Google、Yahoo!、Facebook、NASA、 百 度 、 腾 讯 以 及 美 团 等 。 


004 


第 项 章 Python 快速 入 门 


SN -EE 


1-2 Python 应 用 领域 


1.2 ”建立 Python 程序 开发 环境 


因为 Python 具有 跨 平台 运行 的 特性 , 可 以 运行 在 Windows、Mac 和 各 种 Linux/UNIX 系统 上 。 在 Windows 
上 写 Python 程序 ， 放 到 Linux 上 也 是 能 够 运行 的 。 要 开始 学 习 Python 编程 ， 首 先 就 需要 把 Python 安装 到 
计算 机 里 。 完 成 安装 后 ， 会 得 到 Python 解释 器 (就 是 负责 运行 Python 程序 的 )， 一 个 命令 行 交互 环境 ， 还 
有 一 个 简单 的 集成 开发 环境 。 本 节 将 详细 讲解 在 Windows 系统 上 建立 Python 语言 开发 环境 的 步骤 及 方法 。 


1.2.1 安装 Python 语言 


目前 ，Python 有 两 个 版 本 ， 一 个 是 2 和 版， 一 个 是 3.X 版 ， 这 两 个 版 本 是 不 兼容 的 。 由 于 3.X 版 越 来 
越 普及 ， 本 书 的 内 容 将 以 Python 3.6.3 版 本 为 基础 。 请 确保 自己 的 计算 机 上 已 经 安装 的 Python 版 本 是 最 新 
的 3.6.3， 这 样 才能 保证 和 本 书 的 操作 具有 一 致 性 。 
在 浏览 器 地 址 栏 中 输入 Python 下 载 页 面 (www.python.org/downloads) 的 地 址 ， 进 入 Python 下 载 主页 
面 。 在 下 载 主页 面 中 显示 提供 适合 Windows 环境 的 3.6.3 和 2.7.14 版 本 的 “下 载 ” 按 钮 ， 以 及 提供 适合 
Linux/UNIX、Mac OS X 和 其 他 环境 的 版 本 链接 ， 如 图 1-3 所 示 。 


1-3 Python 下 载 界面 


根据 操作 系统 不 同 可 以 选择 对 应 的 软件 版 本 安装 。 在 图 1-3 中 ，Download Python 3.6.3 按钮 的 位 置 是 
了 Python 当前 最 新 最 稳定 的 版 本 ， 本 书 将 以 Windows 操作 系统 为 软件 运行 环境 ， 当 前 最 新 的 Python 3.6.3 版 
本 为 例 讲解 Python 语言 。 具 体 软 件 安 装 操作 过 程 如 下 。 

【 例 1-1】 安 装 Python 语言 环境 。 

步骤 1: 单 击 Download Python 3.6.3 按钮 ， 下 载 Python 语言 环境 安装 包 (Python 3.6.3.exe)。 


005 


NN 
Python 人 从 入 门 到 项 目 实践 ( 超 值 版 ) 


SA 


步骤 2: 双击 所 下 载 的 Python 3.6.3.exe 文 件 , 启动 Python 安装 引导 程序 , 在 该 安装 页 面 中 勾 选 Add Python 
3.6 to PATH (Python 的 安装 路 径 添加 到 系统 路 径 ) 复 选 框 ， 如 图 1-4 所 示 。 

注意 : 如 果 Add Python 3.6 to PATH 不 匀 选 ， 在 cmd 下 输入 python 会 报错 ， 提 示 python 不 是 内 部 或 外 
部 命令 ， 也 不 是 可 运行 的 程序 。 
步骤 3: 单 击 Install Now 按钮 ， 开 始 安装 Python 程序 ， 如 图 1-5 所 示 。 


= x 


Bm yhon 363 Ba Seup 


Install Python 3.6.3 (32-bit) 
Select Install Now to nstall Python wth cefault settngs, or chcose 


Customize to enable or disable features 


由 install Now 


J Setup Progress 
netaling: 
Python 353 Siandard Library B2-bi 
© 
> Customize installation 


[Bu i python 
| windows 至 Ganeel windows Canee 


图 1-4 安装 程序 启动 页 面 图 1-5 程序 开始 安装 
步骤 4: 软件 安装 完成 后 ,安装 界面 将 显示 安装 成 功 页 面 ， 单 击 Close 按钮 关闭 程序 安装 界面 ， 便 完成 
了 Python 语言 开发 环境 的 安装 ， 如 图 1-6 所 示 。 
步骤 5: Python 完成 安装 后 ， 将 在 系统 中 安装 一 批 与 Python 开发 和 运行 相关 的 环境 程序 ， 其 中 最 重要 
的 两 个 程序 分 别 是 Python 集成 开发 环境 (IDLE) 和 Python 命令 行 ， 如 图 1-7 所 示 。 


x 


Dh yrhen 383 [52-60 Seup 
| Setup was successful 
Special thanks to Mark Hammond without whose years of 
treely shared Windows expert fo 
stil be Python tor DOS. 


2 New to Pytnon? Start witn the onlne Wioral ang 
ai 


See what's ew in this ralesse. 


sincluding Python 


1-6 程序 安装 完成 界面 1-7 Python 软件 及 环境 

步骤 6: 测试 安装 是 否 成 功 。 执 行 “ 运 行 ”命令 ， 在 “运行 ”文本 框 中 输入 cmd 命令 ， 如 图 1-8 所 示 ， 
单 击 “ 确 定 ”按钮 ， 进 入 命令 提示 符 。 

步骤 7: 在 命令 符 下 输入 python 命令 并 按 Enter 键 确认 ， 验 证 是 否 安装 成 功 ， 会 出 现 以 下 两 种 情况 。 

情况 一 : 进入 Python 交互 式 环境 界面 。 

如 果 能 看 到 如 图 1-9 所 示 的 Python 交互 式 环境 界面 ， 就 说 明 Python 安装 成 功 。 

情况 二 : 得 到 一 个 错误 提示 。 

看 到 如 图 1-10 所 示 的 Python 错误 提示 界面 ， 提 示 “ 了 Python 不 是 内 部 或 外 部 命令 ， 也 不 是 可 运行 的 程 
序 或 批 处 理 文件 。” 
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本 运行 


珂 Windows 梅 根据 你 所 输入 的 名 称 ， 为 你 打开 框 应 的 程序 、 
文件 夫 、 文 | 或 Internet 资源 


打开 (O): 


确定 取消 浏览 (B)… 


图 1-8 “运行 ”对 话 框 图 1-9 ”Python 交互 式 环境 

这 是 因为 Windows 会 根据 一 个 Path 的 环 
境 变 量 设 定 的 路 径 去 查找 python.exe, 如 果 没 
找到 ， 就 会 报错 。 如 果 在 安装 时 漏 掉 了 勾 选 | oiniswater ms) 


Add Python 3.6 to PATH 复 选 框 ， 那 就 需要 手 | | = 全 
puuGINp pAprogram Fies (x85)\Foxt Software\Foxit Reader\plugins\ 
动 将 python.exe 所 在 的 路 径 添 加 到 Path 中 。 人 SR 人 


Vadministrato AppData\L ocal\programs\Python\Python35-32\, 


步骤 8: 手动 添加 Python 所 在 的 路 径 到 | *， 
Path 中 ， 右 击 “ 计 算 机 ”一 “ 属 和 2 
级 系统 设置 ”一 “高 级 ”一 “环境 变量 ”一 
Administrator 的 用 户 变量 ， 单 击 “ 新 建 ” 按 
钮 ， 新 建 Path 变量 名 及 变量 值 (浏览 目录 选 | ,sms 
择 python.exe 文件 )， 最 后 单 击 “ 确 定 ”按钮 [yma 本 
完成 变量 新 建 操作 ， 如 图 1-11 所 示 。 


atorAppData\LocalvTemp 
atorAPpData\LocalTemP 


变 旦 仿 IN): path 
Commnd promp -oo x 
变量 值 W)， CAUcereAdminictrator ppData\Local\Programe\Python\Python36-32\python.exe 
RD)- RN 有 | 
新 建 [W)， 编 很 (1). CD 
确定 取消 
图 1-10 “Python 错误 提示 界面 图 1-11 添加 Python 路 径 


如 果 不 知道 怎么 修改 环境 变量 ， 建 议 把 Python 安装 程序 重新 运行 一 遍 ， 务 必 勾 选 Add Python 3.6 to 
PATH 复 选 框 。 

步骤 9: 在 >>> 命 令 提 示 符 中 输入 “exit0 ”并 按 Enter 键 ， 就 可 以 退出 Python 交互 式 环境 (直接 关 掉 命 
令 行 窗口 也 可 以 )。 接 下 来 便 可 踏 上 Python 的 编程 之 路 了 。 


1.2.2 ”编写 第 一 个 Python 程序 “Hello World!” 


学 习 了 Python 语言 环境 的 安装 ， 接 下 来 就 可 以 正式 进入 Python 编程 环节 了 。 

在 写 代码 之 前 ， 切 记 不 要 用 “复制 ”或 “粘贴 ”的 方式 将 代码 从 页 面 粘贴 到 自己 的 计算 机 上 ， 这 样 很 
容易 出 错 。 编 写 程序 需要 养 成 一 个 好 的 习惯 ， 最 好 逐个 地 将 代码 输入 进去 ， 在 输入 代码 的 过 程 中 ， 初 学 
经 常会 输 错 代码 ， 所 以 需要 仔细 地 检查 、 对 照 ， 才 能 以 最 快 的 速度 掌握 如 何 写 程序 。 编 写 代码 的 过 程 也 是 
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与 程序 交流 沟通 的 过 程 。 

在 Python 交互 式 环境 界面 的 命令 提示 符 “>>>” 后 直接 输入 代码 ， 回 车 ， 就 可 以 立刻 得 到 代码 执行 结 
果 。“>>>” 命 令 提示 符 ， 这 就 相当 于 计算 机 在 问 用 户 需要 它 做 什么 。 现 在 ， 试 试 输入 “300+200”， 看 看 计 
算 结果 是 不 是 500。 

>>> 300+200 

500 


了 Python 很 简单 吧 ? 在 不 知 不 觉 中 已 经 完成 了 一 个 程序 的 运行 。 

1.“Hello World” 的 由 来 

“Hello，World” 最 早 是 由 Brian Kemighan 创建 的 。1978 年 ，Brian Kernighan 编写 了 一 本 名 叫 《C 程序 
设计 语言 》 的 编程 书 ， 在 程序 员 中 广 为 流传 。 他 在 这 本 书 中 第 一 次 引用 了 “Hello World” 程 序 。 

实际 上 ， 这 个 十 分 简洁 的 程序 ， 在 功能 上 只 是 告知 计算 机 显示 “Hello World” 这 句 话 。 程 序 员 一 般 用 
这 个 程序 测试 一 种 新 的 系统 或 编程 语言 运行 是 否 正常 。 当 他 们 看 到 这 两 个 单词 显示 在 计算 机 屏幕 上 时 ， 往 
往 表示 代码 已 经 能 够 编译 、 装 载 以 及 正常 运行 了 ， 这 个 输出 结果 就 是 为 了 证 明 这 一 点 。 

2. 运行 Python“Hello World” 

在 计算 机 行业 里 面 ， 学 习 任何 一 门 编程 语言 ， 大 家 公认 的 有 一 个 惯例 性 的 公式 ， 即 运行 简单 的 “Hello 
World” 程序 。 为 什么 称 第 一 个 程序 为 “Hello World” 呢 ? 这 个 程序 虽 小 ， 但 却 已 经 完成 了 程序 运行 的 全 过 
程 ， 是 初学 者 接触 编程 语言 的 第 一 步 。“Hello World” 的 字面 意思 是 “你 好 ， 世 界 ”， 也 就 是 跟 世 界 打招呼 ， 
告诉 世界 ， 我 的 第 一 个 程序 在 这 个 世界 上 诞生 了 ， 从 此 便 进入 了 编程 的 世界 。 

使 用 Python 语言 编写 的 “Hello World” 程 序 只 有 一 行 代码 。 

【 例 1-2】 Python 语言 输出 “Hello World”。 


>>>print ("Hello World") 
Hello World 


第 01 行 的 “>>>” 是 Python 语言 运行 环境 的 命令 提示 符 。 

了 Python 打印 输出 指定 文字 的 操作 是 通过 print0 函 数 实现 的 。 把 希望 打印 的 文字 用 单 引 号 或 者 双 引 号 括 
起 来 ， 但 不 能 混用 单 引号 和 双 引 号 。 这 种 用 单 引号 或 者 双 引 号 括 起 来 的 文本 在 程序 中 叫 字符 串 ， 以 后 会 经 
常 遇 到 。 

第 02 行 是 Python 语句 的 执行 结果 ， 输 出 “Hello World”。 

Python 语言 非常 简洁 ， 下 面 再 看 看 C 语言 的 “Hello World” 程 序 。 

#include <stdio.h> 


int main (void) 


下 


printf ("Hello World\n"); 
return 0; 


} 

一 般 来 说 ,实现 同样 功能 的 程序 ，Python 语言 实现 的 代码 行 数 仅 相当 于 C 语言 的 115 一 1/10， 简 洁 程度 
取决 于 程序 的 复杂 度 和 规模 。 

最 后 ， 用 exit0 命 令 退出 Python 环境 ， 第 一 个 Python 程序 完成 。 唯 一 的 缺憾 是 没有 保存 下 来 ， 下 次 运 
行 时 还 要 再 输入 一 遍 代码 ， 程 序 的 保存 在 后 面 会 讲解 到 。 


线 1.2.3 ”运行 Python 程序 
运行 Python 程序 有 两 种 方式 : 交互 式 和 文件 模式 。 交互 式 是 指 Python 解释 器 即时 响应 用 户 输入 的 每 条 
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指令 代码 ,同时 给 出 输出 结果 反馈 。 文件 模式 也 称 批量 式 , 指 用 户 将 Python 程序 编写 在 一 个 或 多 个 文件 中 ， 
然后 启动 Python 解释 器 运行 程序 批量 执行 文件 中 的 代码 。 交 互 模式 常用 于 少量 代码 的 调试 ， 文 件 模式 则 是 
最 常用 的 编程 模式 。 常 用 的 编程 语言 仅 有 文件 模式 的 执行 方式 。 接 下 来 以 Windows 操作 系统 中 运行 “Hello 
World!” 程 序 为 例 ， 介 绍 交互 式 和 文件 模式 的 启动 和 执行 方法 。 

1. 交互 式 运行 Python 程序 

交互 式 启动 和 运行 Python 程序 有 两 种 方式 可 以 实现 , 分 别 是 执行 命令 行 工具 和 启动 Python 集成 开发 环 
境 (IDLE)。 

(1) 执行 命令 行 工具 方式 。 
步骤 1: 执行 “运行 ”命令 ， 在 “运行 ”文本 框 中 输入 cmd 命令 或 启动 Windows 操作 系统 命令 行 工 具 
(<Windows 系统 安装 目录 >\system32\cmd.exe), 在 命令 符 下 输入 python 命令 并 按 Enter 键 确认 , 进入 Python 
交互 式 窗口 。 
步骤 2: 在 “>>>” 命 令 提 示 符 中 输入 如 下 代码 行 。 

print ("Hello World!") 

步骤 3: 输入 代码 并 按 Enter 键 ， 程 序 便 输 出 “Hello World!”， 如 图 1-12 所 示 。 

步骤 4: 在 “>>>” 命 令 提示 符 中 输入 “exit0” 或 者 “quit0 ”可 以 退出 Python 运行 环境 。 

(2) 运行 Python 集成 开发 环境 (IDLE)。 

步骤 1; 在 Windows 中 执行 “开始 ”一 “程序 ”一 Python 3.6 一 IDLE (Python 3.6 32-bit) 菜单 命令 ， 启 
动 IDLE (Python 3.6 32-bit) 集成 开发 环境 。 

步骤 2， 在 “>>>” 命 令 提 示 符 中 输入 如 下 代码 行 : 

print ("Hello World!") 

步骤 3: 输入 代码 并 按 Enter 键 ， 程 序 便 输出 “Hello World!” 程 序 运行 结果 ， 如 图 1-13 所 示 。 


ims Cod 


图 1-12 通过 命令 行 启动 交互 式 Python 运行 环境 图 1-13 通过 IDLE 行 启动 交互 式 Python 运行 环境 


2. 文件 模式 运行 Python 程序 

文件 模式 也 有 两 种 运行 方式 ， 与 交互 式 相对 应 。 

(1) 通过 命令 行 运行 Python 程序 文件 。 

步骤 1: 自 建 Python 文件 。 打开 记事 本 或 其 他 文本 工具 , 按照 Python 的 语法 格式 编写 代码 , 并 保存 为 .py 
格式 的 文件 。 这 里 仍 以 “Hello World!” 为 例 ， 将 代码 保存 为 hello.py 文件 ， 如 图 1-14 所 示 。 

步骤 2: 启动 Windows 操作 系统 命令 行 工具 (<Windows 系统 安装 目录 >\system32\cmd.exe), 打开 Windows 
的 命令 行 窗口 并 执行 “cd /” 命 令 进入 hello.py 文件 所 在 的 目录 (本 例 hello.py 文件 位 于 C 盘 中 )， 在 命令 行 
输入 “Python hello py” 命 令 并 按 Enter 键 运行 程序 ， 如 图 1-15 所 示 。 
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司 helopy -is = 省 
文 必 旧 ” 往 各 日 个 z(O) 二 者 V] 二 (H) 
print ("Hello World!”) 


图 1-14 创建 hello.py 文 件 图 1-15 通过 命令 行 运行 Python 程序 文件 
(2) 通过 IDLE 创建 并 运行 Python 程序 文件 。 
步骤 1: 启动 IDLE， 在 Python 3.6.3 Shell 窗口 的 菜单 栏 中 执行 File 一 New File 命令 或 者 按 Ctl+ N 组 合 键 
打开 新 建 窗口 。 按 照 Python 的 语法 格式 编写 代码 : print("Hello World!")， 如 图 1-16 所 示 。 
步骤 2: 保存 并 运行 程序 。 将 新 建 的 程序 保存 到 C 盘 ， 文 件 名 为 “hello.py”， 在 菜单 栏 中 执行 Run 一 
Run Module 命令 或 者 按 F5 快捷 键 运行 该 文件 ， 如 图 1-17 所 示 。 


3 访 


Lr6 Cok4bo 


图 1-16 创建 hello py 文件 1-17 ”通过 IDL 创建 和 运行 Python 程序 文件 


3. 推荐 启动 Python 程序 方法 

交互 式 和 文件 运行 模式 共有 4 种 启动 和 运行 Python 程序 的 方法 ， 其 中 最 常用 和 最 重要 的 还 
的 文件 模式 方法 ， 该 种 方法 也 是 推荐 读者 使 用 启动 和 运行 Python 程序 的 方法 。 

Python 所 集成 的 IDLE 是 一 个 最 简单 和 有 效 的 集成 开发 环境 ， 无 论 是 人 机 交互 模式 还 是 文件 模式 ， 均 
能 快速 有 效 地 编写 和 调试 程序 代码 。 


了 
型 
日 
HH 


1.3 熟悉 Python 解释 器 与 IDE 


学 习 Python 编程 ， 首 先 需要 把 Python 软件 安装 到 计算 机 中 ， 这 样 就 有 了 Python 解释 器 简单 的 开发 环 
境 。 集 成 开发 环境 (Integrated Development Environment，IDE) 是 用 于 提供 程序 开发 环境 的 应 用 程序 ， 一 
般 包括 代码 编辑 器 、 编 译 器 或 解释 器 、 调 试 器 和 图 形 用 户 界面 工具 ， 同 时 还 具有 对 所 开发 程序 的 运行 、 调 
试 、 打 包 、 发 布 等 功能 。 
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举 个 例子 ， 下 载 了 一 部 电视 剧 ， 不 同 格式 的 视频 需要 具有 对 应 解码 器 的 播放 器 来 播放 ， 这 个 播放 器 就 
相当 于 “开发 环境 ”。 如 果 想 给 这 个 片子 配 上 字幕 ， 剪 辑 一 下 或 再 加 点 儿 特效 等 操作 ， 就 需要 用 到 功能 更 为 
强大 的 视频 剪辑 工具 ， 而 不 是 仅仅 具有 播放 功能 的 播放 器 了 。 这 种 功能 超 强 的 工具 ， 就 是 超 强 工 具 集 ， 相 
当 于 “集成 开发 环境 ”。 


1.3.1 ”Python 解释 器 


完成 Python 程序 代码 编写 时 ， 将 获得 以 .py 为 扩展 名 的 Python 代码 文本 文件 。 要 让 计算 机 读 懂 并 运行 
这 些 代码 ， 就 需要 在 Python 解释 器 的 帮助 下 执行 .py 文件 。 安 装 Python 软件 后 ， 就 直接 获得 了 一 个 官方 版 
本 的 解释 器 : CPython 解释 器 。 这 个 解释 器 是 用 C 语言 开发 的 ， 所 以 叫 CPython。 在 命令 行 下 运行 Python 
就 是 启动 CPython 解释 器 。CPython 是 使 用 最 广 的 Python 解释 器 。 

由 于 Python 语言 从 规范 到 解释 器 都 是 开源 的 ， 所 以 理论 上 ， 只 要 水 平 够 高 ， 任 何人 都 可 以 编写 Python 
解释 器 来 执行 Python 代码 (当然 难度 很 大 )。 事 实 上 ， 确 实 除 了 CPython 解释 器 外 还 存在 多 种 Python 解释 
器 ， 常 见 的 还 有 如 下 解释 器 。 

1. IPython 解释 器 

IPython 是 基于 CPython 之 上 的 一 个 交互 式 解释 器 ， 比 默认 的 Python Shell 好 用 很 多 ， 支 持 变量 自动 补 
全 ， 自 动 缩 进 ， 支 持 bash shell 命令 ， 内 置 了 许多 很 有 用 的 功能 和 函数 。IPython 只 是 在 交互 方式 上 有 所 增 
强 ， 但 是 执行 Python 代码 的 功能 和 CPython 是 完全 一 样 的 。 好 比 很 多 浏览 器 虽然 外 观 不 同 ， 但 内 核 其 实 都 
是 调用 了 正 。 

2. PyPy 解释 器 

PyPy 是 另 一 个 Python 解释 器 ， 执 行 速度 快 。PyPy 采用 JIT 技术 ， 对 Python 代码 进行 动态 编译 (注意 
不 是 解释 )， 所 以 可 以 显著 提高 Python 代码 的 执行 速度 。PyPy 比 CPython 更 加 灵活 ， 易 于 使 用 和 试验 ， 以 
制定 具体 的 功能 在 不 同情 况 的 实现 方法 ， 可 以 很 容易 实施 。 

虽然 绝 大 部 分 Python 代码 都 可 以 在 PyPy 下 运行 , 但 是 PyPy 和 CPython 有 一 些 是 不 同 的 ， 这 就 导致 
相同 的 Python 代码 在 两 种 解释 器 下 执行 可 能 会 有 不 同 的 结果 。 如 果 代码 要 放 到 PyPy 下 执行 ， 就 需要 了 


3. Jython 解释 器 

Jython 是 运行 在 Java 平台 上 的 Python 解释 器 ， 可 以 直接 把 Python 代码 编译 成 Java 字 节 码 执行 。 它 是 
一 个 Python 语言 在 Java 中 的 完全 实现 。Jython 也 有 很 多 从 CPython 中 继承 的 模块 库 。Jython 不 仅 提 供 了 
Python 的 库 ， 还 提供 了 所 有 的 Java 类 。 

4. IronPython 解释 器 

IronPython 和 Jython 类 似 , 只 不 过 IronPython 是 运行 在 微软 NET 平台 上 的 Python 解释 器 , 可 以 直接 把 
了 Python 代码 编译 成 NET 的 字 节 码 。 

Python 的 解释 器 很 多 ， 但 使 用 最 广泛 的 还 是 CPython。 如 果 要 与 Java 或 NET 平台 交互 ， 最 好 的 办 法 不 
是 用 Jython 或 IonPython， 而 是 通过 网 络 调用 来 进行 交互 ， 确 保 各 程序 之 间 的 独立 性 。 


1.3.2 ”Python 集成 开发 环境 
了 Python 是 一 种 功能 强大 、 语 言 简洁 的 编程 语言 。Python 包括 高 效 的 数据 结构 ， 提 供 简 单 且 高 效 的 面向 
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对 象 编程 。 

了 Python 的 学 习 过 程 少 不 了 代码 编辑 器 或 者 集成 的 开发 编辑 器 (IDE)。 高 效 的 代码 编辑 器 或 者 IDE 通常 
会 提供 插件 、 工 具 等 ， 用 于 帮助 开发 者 提高 使 用 Python 开发 的 速度 ， 提 高 效率 。Python 软件 常用 集成 开发 
环境 如 表 1-2 所 示 。 


表 1-2 ”Python 软件 常用 集成 开发 环境 
各 各 网 址 功能 特性 


PyDev 适合 开发 Python Web 应 用 。 其 特征 包括 自动 代码 完成 、 
语法 高 亮 、 代 码 分 析 、 调 试 器 以 及 内 置 的 交互 浏览 器 


Komodo Edit 是 一 个 免费 开源 专业 的 Python IDE, 其 特征 是 非 菜 
单 的 操作 方式 ， 开 发 高 效 


Vim 是 一 个 简洁 、 高 效 的 工具 ， 适 合 做 Python 开发 


SublimeText 虽然 仅仅 是 一 个 编辑 器 ， 但 是 它 有 丰富 的 插件 ， 使 
得 对 Python 开发 的 支持 非常 到 位 


Emacs 是 一 个 可 扩展 的 文本 编辑 器 ， 同 样 支持 Python 开发 。 


PyDev http://pydev.org 


Komodo Edit http://komodoide.com/komodo-edit 


Vim http://www.vim.org/download.php 


Sublime Text http://sublimetext.com 


i ltl orn/ swemaes Emacs 本 身 以 Lisp 解释 器 作为 其 核心 ， 而 且 包含 大 量 的 扩展 插件 
Wing 是 一 个 Python 语言 的 超 强 IDE， 适 合 做 交互 式 的 Python 
Wing https://wingware.com 开发 。 同 样 支持 自动 代码 完成 、 代 码 错误 检查 、 开 发 技巧 提示 
等 ， 也 支持 多 种 操作 系统 ， 包 括 Windows、Linux 和 Mac OSX 
PyScripter 是 一 个 开源 的 Python 集成 开发 环境 ， 很 富有 竞争 力 ， 
PyScripter https://code.google.com/p/pyscripter | 同样 有 诸如 代码 自动 完成 、 语 法 检查 、 视 图 分 割 、 文 件 编辑 等 


功能 


1.3.3 安装 PyCharm IDE 


为 了 使 读者 对 IDE 有 个 感性 认识 ,在 这 里 选择 PyCharm 集成 开发 环境 进行 基本 介绍 。PyCharm 是 一 个 
跨 平台 的 Python 开发 工具 ， 是 JetBrains 公司 的 产品 。 其 特征 包括 : 自动 代码 完成 、 集 成 的 Python 调试 器 、 
括号 自动 匹配 、 代 码 折 又 。PyCharm 支持 Windows、Mac OS 以 及 Linux 等 系统 , 而 且 可 以 远程 开发 、 调 试 、 
运行 程序 等 。 安 装 使 用 PyCharm 请 执行 如 
下 操作 。 

【 例 1-3】 安 装 PyCharm IDE。 

步骤 1: 在 浏览 器 中 打开 http://www. 
jetbrains.com/pycharm/download 下 载 页 面 。 


Download PyCharm 


提供 Professional 专业 版 〈 需 购买 注册 或 者 ein CD 
使 用 免费 30 天 ) 和 Community 社区 版 ( 锡 Ee te 
费 ) 两 个 版 本 ， 在 功能 方面 有 所 差异 。 根据 | 一 一 ED ED 
自己 的 需求 下 载 这 里 以 Windows 专业 版 ”| 一 

为 例 )， 如 图 1-18 所 示 。 1-18 ”PyCharm 下 载 页 面 


步骤 2: 直接 双击 下 载 好 的 pycharm-professional-2017.2.4.exe 文件 进行 安装 ， 如 图 1-19 所 示 。 
步骤 3: 单 击 Next 按钮 ， 在 设置 软件 安装 路 径 文本 框 中 使 用 默认 或 者 选择 指定 新 的 安装 路 径 后 ， 单 击 
Next 按钮 继续 安装 ， 如 图 1-20 所 示 。 
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加 charm Setup x @ mcham setup = x 
Gu busa teen 
PC Welcome to PyCharm Setup eee te lie nhch netalPydam 
Seap rh gude you drough tre rstslason of Pychame seap sl rsalpychamin pe biowng falder, To rstalin a dfeent ide, dc Browse 
et a et entre 


I recommended that you cose a other epocatons 
beiore ctarirg Setup The wl mabe tt parebe to update 
Treevantsysten fles virout navwrg to eooot vou 

Coputer 


Ea Em Fd 
图 1-19 PyCharm 安装 界面 图 1-20 设置 PyCharm 安装 路 径 


步骤 4: 在 新 的 安装 界面 中 ， 复 选 创建 桌面 快捷 方式 模式 和 设置 关联 文件 的 扩展 名 文件 。 单 击 Next 按 


钮 继续 安装 ， 如 图 1-21 所 示 。 

步骤 5: 单 击 Next 或 Install 按钮 就 可 以 完成 软件 的 安装 ， 如 图 1-22 所 示 。 

@ emam sre 芝 x 加 PyCharm seup 三 
语 em aoe PC Completng Pycham Solup 


Pycherm hes been ratoled on your computer. 
Create Decktap crorteut 

Chk neh w core Seup, 
Daz louncher 6sbitlauncner 


reate assocatons 口 hnproem 
Bry 
| 
me es] ee a Be 
图 1-21 设置 PyCharm 安装 选项 图 1-22 完成 PyCharm 软件 的 安装 


1.3.4 运行 PyCharm IDE 


完成 PyCharm 软件 的 安装 后 ， 需 要 进行 必要 的 设置 和 项 目 新 建 才能 运行 。 具 体操 作 方法 如 下 。 

【 例 1-4】 运 行 PyCharm IDE 开发 环境 。 

步骤 1: 首次 启动 PyCharm 软件 ， 可 以 在 应 用 菜单 或 桌面 中 单 击 PyCharm 图 标 。 初 次 启动 软件 会 显示 
一 个 提示 界面 ， 询 问 是 否 导 入 前 一 版 本 的 PyCharm 设置 。 由 于 是 初次 安装 ， 直 接 使 用 默认 选项 单 击 OK 按 
钮 即 可 ， 如 图 1-23 所 示 。 


国 Complete Installation x 


Tmport PyCharm settings from 
ustom Location Config folder or installation home of the previous 
on 3 Eee 


CC \program Files\JetBrainsVPyChara 2017 2 4 


图 De not import settines 


1-23 ”初次 启动 PyCharm 软件 提示 界面 
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步骤 2: 进入 PyCharm 软件 激活 界面 。 如 果 和 暂时 还 没有 购买 该 软件 ， 可 以 先 免费 试用 30 天 ， 如 图 1-24 
所 示 。 

步骤 3: 选择 PyCharm 预 设 的 快捷 键 方案 ， 如 Eclipse、Visual Studio 等 ， 也 可 以 设置 PyCharm 主题 ， 
包括 字体 、 背 景 颜色 这 些 等 。 如 果 没有 特别 偏好 的 主题 ， 也 可 以 直接 单 击 OK 按钮 接受 系统 默认 设置 ， 如 
图 1-25 所 示 。 


PyCharm License Activation =- x 


Oactivate @ 


Evaluation is free for 30 days 


Tell me about new product features as they come out a a en 
Raail address (optional) 


Keymap scheme: ntell] IDEA Cassic 
IDE themes me 


Editor colors and fonts: [Default 


Plickto preview 


You can use File | Setings to configure any of these settings later. 


Ei 全 测 | 
1-24 试用 PyCharm 软件 1-25 ”PyCharm 主题 设置 
步骤 4: 创建 新 项 目 。 单 击 Create New Project 创建 新 项 目 项 ， 如 图 1-26 所 示 。 
步骤 5， 在 “新 建 项 目 ” 窗 口中 ,设置 项 目 文件 夹 的 位 置 与 使 用 的 Python 解释 器 。 根 据 工作 需要 可 能 
计算 机 中 安装 不 止 一 个 版 本 的 Python 运行 环境 , 在 这 里 可 以 管理 、 选 择 不 同 的 Python 环境 来 开发 或 调试 程 


序 。 这 里 选择 在 D:\pythonCode 文件 中 创建 新 项 目 ， 单 击 Create 按钮 ， 接 下 来 就 可 以 创建 新 项 目 了 ， 如 图 
1-27 所 示 。 


国 Wecome to cam 专 x 三 x 
Deerien: [Dr ortols 回 
启 , roprere SC UsorsWioninisrrarer ViraralLeca Peoerans Ph ~ | 
PyCharm 
于 czeate ee 

晤 Cha sut fanm Wareiea Cratrsl = 

se。 lio nb, | | 。 
1-26 ”创建 新 项 目 1-27 创建 新 项 目 


步骤 6: 新 建 一 个 Python 文件 。 右 击 刚 建 好 的 项 目 文件 夹 , 在 弹出 的 快捷 菜单 中 执行 New 一 Python File 
菜单 命令 ， 创 建 一 个 名 称 为 “hello py” 的 Python 文件 ， 单 击 OK 按钮 完成 文件 新 建 ， 如 图 1-28 所 示 。 
步骤 7: 在 新 文件 代码 窗口 中 , 编写 “Hello World” 程序 并 执行 。 执行 程序 可 以 单 击 文件 名 右 侧 的 * 按 
钮 或 右 击 ， 在 弹出 的 快捷 菜单 中 选择 Run rhello' 菜 单 命令 ， 程 序 运 行 的 结果 会 显示 在 下 面 的 窗 体 中 ， 如 
1-29 所 示 。 
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步骤 8: 至 此 ， 便 完成 了 在 PyCharm 中 完整 文档 的 新 建 及 运行 操作 。 


国 pytencode - pspyhoncodal - mchemn 201724 - Oo x 


图 1-28 创建 新 文件 


国 pythonCode - [DA\pythonCode] - -helopy - PyCharm 201724 - 0 x 
File Edit View Navigate Code Refactor Run Toole VCS Window Help 

ie Es OTEEEE 
?ret CE 
(pythoncods bos | 

ateraal Libearine 


后 费 ，pythen 55.3 kitusersvidaiaiatrad 三 
Betondod Definirione 


CelrAlrShiftrC 


MW Binary seelerons 
D- Prthen26-29 lihrery ront 车 Ponte curly 

a Poste from History.. celrshiftry 
ET Paste Simple CelrAhrshfrv 


itepackoers 
3 MN Trpeshed Sewbs Alt+Shil+insert 


me 
bp | Vss Wein ssator WApoDaralLocal\Pr stra 民 
ml 
联 Ron hello with Coverage 
poeers finished with erit eede 1 @ profle helo: 
外 | 图 守 Concumency Diagram for hello' 


Se belo 


[I 


图 1-29 创建 新 文件 


1.3.5 设置 PyCharm IDE 


完成 PyCharm 的 安装 后 ， 可 以 根据 自己 的 喜好 对 界面 风格 、 主 题 色彩 、 字 体 、 颜 色 以 及 Python 文档 模 
板 等 进行 设置 。 
1. 设置 背景 主题 
村 景 主题 的 具体 设置 方法 如 下 。 
在 菜单 栏 中 执行 File 一 Settings 菜单 命令 打开 设置 对 话 框 ， 并 展开 Appearance & Behavior 一 Appearance 
选项 。 在 打开 的 外 观 设置 对 话 框 中 ， 单 击 UI Options 下 UI 选项 栏 下 Theme 主题 对 应 的 下 拉 菜单 ， 选 择 一 
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AS 


个 喜欢 的 主题 ， 如 图 1-30 所 示 。 


国 Serings 


appearanee & gehavior » Appearance 


DO preg-n-Drop wath ALT prosced oniy 


i 
o 1209 


司 biur ER 


Wdow options 


回 winate widow 


DO Show tool window bers 


Show memor neicator Show tool window numbers 


0 A mr ] com 
图 1-30 外观 设置 
注意 : 此 时 位 于 对 话 框 右上 角 有 一 个 Reset 按钮 ， 如 果 想 撤销 当前 设置 ,可 以 通过 单 击 这 个 按钮 来 恢复 
之 前 的 设置 。 同 时 当 光 标 移动 至 Apply 按钮 时 ， 它 将 变 为 可 用 状态 ， 如 图 1-31 所 示 。 


x 


1-31 应 用 主题 设置 
在 该 外 观 设 置 对 话 框 中 ， 也 可 以 更 改 其 他 外 观 选 项 的 设置 ， 例 如 ， 字 体 和 字号 、 窗 口 属性 等 。 
2. 设置 新 建 模板 默认 信息 
在 PyCharm 使 用 过 程 中 ， 对 于 正式 文档 需要 有 声明 行 和 关于 代码 编写 者 的 一 些 个 人 信息 ， 使 用 模板 的 


方式 可 以 实现 方便 快捷 填写 。 具 体 设置 方法 如 下 。 
步骤 1: 在 菜单 栏 中 执行 File 一 Settings 菜单 命令 打开 设置 对 话 框 。 选 择 Editor-*Color Style 一 File and 
Templates 一 Python-Script 菜单 项 ， 如 图 1-32 所 示 。 


步骤 2: 在 Python-Script 代码 区 域 ， 可 以 根据 自己 的 需要 输入 和 编辑 内 容 。 完 成 设置 后 单 击 OK 按钮 ， 
确认 设置 ， 如 图 1-33 所 示 。 
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图 1-32 应 用 主题 设置 


1-33 ”设置 模板 变量 信息 
常见 预定 义 模板 文件 变量 如 表 1-3 所 示 。 


表 1-3 预定 义 模板 文件 变量 


名 称 说 明 名 称 说 明 
执 /usr/bin/python3 shebang 行 $ {MONTH} 获取 当前 月 份 
$ {PROJECT_NAME} 获取 当前 项 目的 名 称 $ {DAY} 获取 当前 月 的 当天 
获取 “新 建文 件 ” 设 定 的 文 

S NAME} 全 s {HOUR} 获取 当前 的 小 时 数据 
5 {USER} 获取 当前 用 户 的 登录 名 $ {MINUTE} 获取 当前 分 钟 数据 

$ {DATE} 获取 当前 的 系统 日 其 $ {PRODUCT_NAME} SE 

的 名 称 

$ {TIME} 获取 当前 的 系统 时 间 $ {MONTH NAME SHORT} si 本 
S$ {YEAR} 获取 当前 年 日 期 $ {MONTH NAME FULL} 获取 一 个 月 的 全 名 


017 


Python 从 入 门 到 项 目 实践 ( 超 信 版 ) 
NS se 


a 


步骤 3: 在 PyCharm 中 新 建 一 个 文档 , 代码 区 域 便 可 自动 显示 所 设置 的 模板 变量 信息 , 如 图 1-34 所 示 。 


国 phoncode -mypythorCodal- ~ chonhelio py -mych 


图 1-34 ”新建 文档 显示 模板 变量 信息 


1.4 就业 面试 技巧 与 解析 


面试 官 : 什么 是 Python? 使 用 Python 有 什么 好 处 ? 
应 聘 者 : Python 是 一 种 编程 语言 ， 它 有 对 象 、 模 块 、 线 程 、 异 常 处 理 和 自动 内 存 管 理 。 它 简洁 、 简 单 、 
方便 、 容 易 扩展 ， 有 许多 自 带 的 模块 ， 而 且 它 开 源 。 
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> 学习 指引 


本 章 重点 学 习 Python 中 的 一 些 语法 元 素 结构 和 运算 符 ， 和 学 习 其 他 语言 一 样 ，Python 也 有 自己 的 一 些 
语法 规则 。 作 为 开发 人 员 ， 我 们 要 遵循 这 些 规则 ， 开 发 起 来 才 更 加 高 效 。Python 语言 采用 严格 的 “ 缩 进 ” 
来 表明 程序 的 格式 框架 。 缩 进 指 每 一 行 代 码 开始 前 的 空白 区 域 ， 用 来 表示 代码 之 间 的 包含 和 层次 关系 。 


二 ”重点 导读 


*。 程序 设计 语言 基础 。 

。 了 解 Python 语言 基础 知识 。 

。 掌 握 Python 程序 开发 环境 的 建立 。 

* 熟悉 Python 解释 器 与 集成 开发 环境 的 使 用 。 
* 热 悉 程 序 运行 流 程 。 


2.1 编程 基础 知识 


软件 是 按照 需求 事先 设计 并 按照 指定 顺序 执行 的 数据 和 指令 的 序列 集合 ， 是 计算 机 系统 中 与 硬件 相互 
依存 的 部 分 。 按 功能 划分 软件 可 分 为 : 系统 软件 和 应 用 软件 。 系 统 软 件 是 指 用 于 控制 计算 机 运行 、 管 理 计 
算 机 的 各 种 资源 ， 并 为 应 用 软件 提供 支持 和 服务 的 一 类 软件 ， 如 操作 系统 、 数 据 库 管理 系统 、 设 备 驱 动 程 
序 等 ; 应 用 软件 是 指 以 实现 某 一 专门 的 应 用 目的 或 特定 服务 而 开发 的 计算 机 软件 ， 如 办 公 软 件 、 视 频 软件 、 
游戏 以 及 财务 管理 软件 等 。 


2.1.1 软件 开发 流程 


软件 开发 流程 即 软件 设计 思路 和 方法 实现 的 一 般 过 程 。 一 个 软件 的 开发 的 完整 过 程 ， 始 于 软件 开发 计 
划 ， 止 于 软件 运营 维护 ， 其 中 还 包括 设计 软件 的 功能 和 实现 的 算法 和 方法 、 软 件 的 总 体 结构 设计 和 模块 设 
计 、 编 程 和 调试 、 程 序 联 调和 测试 以 及 编写 、 提 交 程 序 等 。 
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“2.1.2 程序 的 运行 流程 
软件 的 运行 过 程 就 是 模拟 人 类 解决 问题 的 思路 、 方 法 和 手段 并 通过 编译 以 计算 机 能 够 识别 的 形式 告诉 
”计算 机 ， 使 得 计算 机 能 够 根据 人 的 指令 一 步 一 步 去 工作 ， 完 成 某 种 特定 的 任务 。 这 种 运算 交流 的 过 程 就 是 
软件 运行 流程 。 程 序 运行 通常 是 数据 运算 的 过 程 ， 数 据 运算 包括 三 个 重要 要 素 : 输入 数据 (获取 数据 )、 处 
理 数据 和 输出 数据 ， 如 图 2-1 所 示 。 
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”图 2-1 数据 处 理 三 要 素 


下 面 是 一 个 非常 简单 的 Python 计算 圆 面积 的 程序 。 
【 例 2-1】 输 入 圆 半径 求 圆 面积 。 


R=eval (input (" 请 输入 圆 半径 :") ) 4 运行 程序 提示 “请 输入 圆 半径: ” 
S=3.14*R#R + 将 圆 的 半径 值 输入 图 的 面积 公式 中 并 计算 
Print (" 贺 的 面积 ，"v"$%.2f”% S) + 输出 加 的 面积 并 保留 两 位 小 数 


程序 运行 流程 中 比较 简单 的 有 数据 存 取 ， 加 减 乘除 ， 罗 辑 运算 ， 复 杂 的 向 量 运算 等 。 如 果 将 各 种 运算 
倒 加 起 来 ， 就 可 以 实现 各 种 复杂 的 运算 功能 。 各 种 游戏 都 是 从 最 基本 的 简单 运算 开始 一 步 一 步 到 复杂 运算 
来 实现 的 。 

1. 输 入 数据 

输入 数据 (Input) 是 一 个 程序 的 开始 。 程 序 要 处 理 的 数据 有 多 种 来 源 ， 形 成 了 多 种 输入 方式 ， 包 括 文 
件 输入 、 网 络 输入 、 控 制 台 输入 、 交 互 界面 输出 、 随 机 数据 输入 、 内 部 参数 输入 等 。 

2. 处 理 数据 

处 理 数据 (Process) 是 程序 对 输入 数据 进行 计算 产生 输出 结果 的 过 程 。 计算 问题 的 处 理 方法 统称 为 “ 算 
法 ”， 它 是 程序 最 重要 的 组 成 部 分 。 可 以 说 ， 算 法 是 一 个 程序 的 灵魂 。 

3. 输 出 数据 

输出 数据 (Output) 是 程序 展示 运算 成 果 的 方式 。 程 序 的 输出 方式 包括 : 控制 台 输 出 、 图 形 输出 、 文 
件 输出 、 网 络 输出 、 操 作 系 统 内 部 变量 输出 等 。 


2.2 ”Python 程序 元 素 构成 


用 Python 编写 的 程序 与 其 他 编程 语言 一 样 ， 也 有 自己 的 基本 结构 和 写法 规范 。 
【 例 2-2】 程序 元 素 构 成 。 
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num=int (input (" 输 入 一 个 数字 : ") ) 
if nums2==0: ## 判 断 该 数字 能 否 束 除 2 成立 则 执行 下 面 的 语句 ,否则 则 执行 对 应 外 层 else 后 的 语句 
if nums5==0: # 如 果 该 数字 能 整除 2, 二 次 判断 能 否 整除 5 
print ("你 输入 的 数字 可 以 整除 2 和 5") 
else: 
print ("你 输入 的 数字 可 以 整除 2, 但 不 能 整除 5") 
else: 
if nums5==0: # 如 果 该 数字 不 能 整除 2, 则 判断 能 否 人 整除 5, 成 立 则 执行 下 面 的 语句, 否则 执行 else 后 的 语句 
print ("你 输入 的 数字 可 以 整除 5, 但 不 能 整除 2") 
else: 


print ("你 输入 的 数字 不 能 整除 2 和 5") 
在 这 一 段 Python 程序 代码 中 包括 : 注释 、 缩 进 、 变 量 、 赋 值 语 句 、 输 入 输出 语句 、 程 序 分 支 语句 等 程 
序 元 素 。 


2.3 ”Python 基本 语法 元 素 


Python 基本 语法 包括 程序 层次 结构 、 代 码 注释 、 换 行 与 并 行 、 变 量 与 保留 字 、 字 符 串 、 程 序 分 支 语句 、 
赋值 语句 和 数据 输入 与 输出 等 元 素 。 下 面 依次 介绍 一 下 这 几 种 元 素 ， 学 习 它 们 的 使 用 方法 和 在 使 用 过 程 中 
应 该 要 注意 哪些 。 


2.3.1 程序 层次 结构 


习惯 了 C 语言 、C++ 之 类 的 程序 结构 ， 初 学 Python 者 经 常会 被 莫名 奇妙 的 缩 进 错误 给 整 迷糊 ，Python 
必须 使 用 正确 的 缩 进 格式 。 在 Python 里 不 能 用 大 括号 “{ } ”来 表示 语句 块 ， 也 不 能 用 开始 或 结束 标志 符 来 
表示 ， 而 是 靠 缩 进来 表示 程序 的 层次 结构 ,“ 缩 进 ” 不 仅 是 为 了 让 程序 结构 好 看 。 
空白 〈 缩 进 ) 在 Python 中 是 非常 重要 的 。 缩 进 是 指 每 一 行 代码 前 端的 空白 区 域 ， 用 来 识别 代码 之 间 的 
包含 和 层次 关系 。 这 意味 着 同一 层次 的 语句 必须 有 相同 的 缩 进 。 每 一 组 这 样 的 语句 称 为 一 个 块 。 借 用 “ 缩 
进 ” 的 方式 会 使 程序 层次 结构 非常 清晰 ， 便 于 代码 阅读 。 

在 Python 代码 编写 过 程 中 ， 缩 进 可 以 通过 按 Tab 键 或 使 用 多 个 空格 〈 通 常 是 4 个 空格 ) 来 实现 。 例 如 
如 下 的 一 段 Python 程序 代码 。 

【 例 2-3】 程序 层 次 结构 。 

num=int (input ("输入 一 个 数字 ") ) 

if num%2==0: 

if num%5==0: # 单 层 代 码 缩 进 
print ("你 输入 的 数字 可 以 整除 2 和 5") #4 多 层 代码 缩 进 ( 缩 进 嵌 套 ) 


else: 


print ("你 输入 的 数字 可 以 整除 2, 但 不 能 整除 5") 


else: 
if num%5==0: 
Print ("你 输入 的 数字 可 以 整除 5, 但 不 能 整除 2") 
else: 


print ("你 输入 的 数字 不 能 整除 2 和 5") 
在 该 段 代码 中 可 以 发 现 ， 除 第 1、2、7 行 代码 外 都 存在 缩 进 ， 不 需要 缩 进 的 代码 项 行 编 写 ， 不 留 空白 
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( 缩 进 )。 其 中 ， 第 3 行 代码 采用 单 层 代码 缩 进 ， 第 4 行 用 到 了 多 层 代码 缩 进 〈 谈 套 缩 进 )。 通 过 缩 进 可 以 很 
清楚 地 分 清 哪个 站 与 else 是 相 匹配 的 条 件 判断 。 通 常 来 说 ， 在 代码 中 判断 、 循 环 、 函 数 以 及 类 等 语法 形式 
使 用 缩 进 形式 来 标识 代码 间 的 包含 关系 ， 能 更 清晰 地 传达 语义 。 但 是 ， 如 果 是 非常 简单 的 语句 不 表达 包含 
关系 ， 就 不 需要 使 用 缩 进 了 。 


print ("Hello World!") 
print ("I like Python.") 


值得 注意 的 是 ， 处 于 同一 级 别 的 代码 缩 进 量 和 缩 进 的 符号 (Tab 键 或 空格 ) 要 保持 一 致 ， 这 样 才能 保 
持 赔 套 的 层次 关系 清晰 正确 。 否 则 ， 由 于 缩 进 的 方式 不 一 致 可 能 导致 举 套 错误 ， 甚 至 会 影响 程序 的 正确 运 
行 。 另 外 ， 在 Python 的 代码 缩 进 中 最 好 采用 空格 的 方式 ， 每 一 层 向 右 缩 进 4 个 空格 ， 通 常 不 建议 采用 Tab 
键 ， 更 不 能 两 种 混合 使 用 。 

另外 ， 现 在 有 一 些 Python 辅助 开发 工具 可 以 自 定义 ， 按 一 次 Tab 键 生成 4 个 空格 的 代码 缩 进 。 还 有 一 
些 工 具 可 以 自动 实现 代码 缩 进 ， 这 些 都 可 以 给 程序 编写 带 来 极 大 的 方便 。 


2.3.2 ”代码 注释 


在 大 多 数 编程 语言 中 ， 注 释 都 是 一 项 很 有 用 处 的 功能 。 注 释 是 程序 员 在 程序 代码 中 添加 的 一 行 或 多 行 
说 明 信 息 ， 在 编程 中 是 很 重要 的 部 分 。 由 于 注释 不 是 程序 的 组 成 部 分 ， 所 以 注释 是 不 被 计算 机 执行 的 。 但 
是 可 以 让 程序 代码 更 易于 被 其 他 程序 员 阅读 ， 它 能 告诉 你 这 段 代码 是 干什么 用 的 ， 提 示 代码 的 可 读 性 。 由 
于 注释 不 被 程序 所 执行 ， 可 以 借用 注释 来 删除 或 跳 过 一 部 分 暂时 不 需要 执行 的 代码 。 例 如 ， 在 如 下 代码 中 ， 
第 1 行 就 是 一 个 注释 ， 会 被 编译 或 者 解释 器 略 去 ， 是 不 被 计算 机 执行 的 。 

【 例 2-4】 代 码 注释 。 

# 下 面 将 打印 出 语句 "Hello World!" 

print ("Hello World!") 

Python 语言 有 两 种 使 用 注释 的 方法 ， 单行 注释 和 多 行 注释 。 单 行 注释 是 在 每 一 行 的 前 面 输入 “#” 号 
“# ”号 后 面 的 内 容 都 会 被 Python 解释 器 忽略 ， 如 下 所 示 。 


# 这 条 是 注释 
# 这 条 还 是 注释 
# 这 条 也 是 注释 


多 行 注释 是 使 用 三 个 单 引号 〈") 来 添加 多 行 注释 ， 如 下 所 示 。 


这 条 是 注释 
这 条 还 是 注释 
这 条 也 是 注释 改 


1. 注释 的 意义 

在 程序 中 编写 注释 的 目的 是 表明 代码 要 做 什么 ， 以 及 是 如 何 做 。 在 项 目 开 发 期 间 ， 程 序 员 可 能 对 程序 
如 何 工作 及 原理 了 如 指 掌 ， 但 过 一 段 时 间 后 ， 部 分 细节 问题 可 能 会 被 遗忘 。 当 然 没 注释 的 程序 是 可 以 花费 
时 间 重 新 研究 代码 来 确定 各 个 部 分 的 工作 原理 ， 这 势必 会 浪费 很 多 时 间 和 精力 。 但 如 果 通 过 编写 注释 ， 以 
清晰 的 自然 描述 语言 对 程序 解决 方案 进行 阐述 ， 可 节省 很 多 时 间 和 精力 。 

现在 编写 项 目 程序 ， 大 多 是 团队 合作 ， 可 能 是 跨 部 门 程序 员 也 可 能 是 跨 公司 的 程序 员 ， 甚 至 是 跨国 的 

序 员 在 一 起 开发 一 个 项 目 。 清 晰 规范 的 程序 重要 ， 清 晰 简洁 的 程序 注释 也 同样 重要 ， 这 样 才能 被 别 的 程 
ee 序 才能 相互 更 好 地 融合 在 一 起 ， 更 利于 团队 项 目的 开发 和 合作 。 
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要 想 成 为 专业 的 程序 员 ， 或 与 其 他 程序 员 有 良好 的 合作 ， 就 必须 编写 有 意义 的 注释 ， 训 练 有 素 的 程序 
员 ， 都 希望 代码 中 包含 注释 ， 因 此 在 程序 中 添加 描述 性 的 语言 注释 ， 是 新 手 最 值得 养 成 的 习惯 和 素养 之 一 。 

2. 注释 的 主要 用 途 

程序 注释 在 程序 开发 中 的 用 途 主 要 表现 在 如 下 几 个 方面 。 

(1) 标注 软件 作者 及 版 权 信 息 。 

在 每 个 程序 源 代码 文件 的 开始 前 增加 注释 ， 如 标记 、 编 写 代码 的 作者 、 日 期 、 用 途 、 版 权 声明 等 信息 。 
根据 注释 内 容 可 采用 单行 或 多 行 注释 。 


# 软件 功能 描述 : 
# Author: 
# 时 间 : 


¥%0121012101060067012600320097009400750063005901 

27012700324099010301050032008900980032009600900121 
01250065008801! &104010700458764009401100093009801 
060071009701050106010g*¥#~03600650096008801220077 
012700580&g%@7620071007800710103005800570061010300 

98011800%# 


or 


// 其 他 注释 信息 : 


(2) 注释 代码 原理 和 用 途 。 

在 程序 关键 代码 附近 增加 注释 ， 解 释 核 心 代码 的 用 处 、 原 理 及 注意 事项 ， 增 加 程序 的 可 读 性 。 由 于 程 
序 本 身 已 经 表达 了 功能 意图 ， 为 了 不 影响 程序 阅读 连贯 性 ， 程 序 中 的 注释 一 般 采 用 单行 注释 ， 标 记 在 关键 
行 与 关键 代码 同行 。 对 于 一 段 关 键 代 码 ， 可 以 在 附近 选择 一 个 多 行 注 释 ， 或 者 多 个 单行 注释 ， 给 出 代码 设 
计 原 理 等 信息 。 

(3) 辅助 程序 调试 。 

在 调试 程序 时 ， 可 以 通过 单行 或 多 行 注释 ， 临 时 去 掉 一 行 或 多 行 与 当前 调试 无 关 的 代码 ， 辅 助 程序 员 
找到 程序 发 生 问题 的 可 能 位 置 。 


2.3.3 ”换行 与 并 行 


在 Python 程序 编写 过 程 中 ， 有 时 会 遇 到 两 行 代码 放 在 同一 行 更 易 懂 或 者 一 行 中 过 长 的 代码 为 了 结构 清 
晰 易 懂 不 适合 放 到 同一 行 中 。 下 面 将 探讨 在 Python 中 如 何 处 理 代码 换行 与 并 行 的 问题 。 

1. 代码 换行 

在 Python 编程 中 一 般 是 一 行 写 完 所 有 代码 ， 如 果 遇 到 一 行 写 不 完 需 要 换行 的 情况 ， 也 人 允许 采用 代码 换 
行 的 方式 将 一 行 代码 分 成 多 行 编写 。 有 如 下 4 种 方法 供 选择 。 

【 例 2-5】 代 码 换行 。 

(1) 在 该 行 代码 末尾 加 上 续 行 符 “\”。 
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(2) 语句 中 包含 0、 人 了、[ 时 分 行 不 需要 加 换行 符 。 


(3) 采用 三 个 单 引号 “"”。 


(4) 采用 三 个 双 引 号 “"""”。 


2. 代码 并 行 


在 Python 代码 缩 进 语句 块 中 如 果 只 有 一 条 语句 ， 将 下 句 代码 直接 写 在 “:” 语 句 后 面 也 是 正确 的 。 
【 例 2-6】 代 码 并 行 。 


在 上 述 程序 代码 的 第 03 行 和 08 行 代码 是 不 被 允许 并 行 到 上 行 代码 “:” 语 句 后 面 的 。 因 为 第 03 行 和 
08 行 代码 后 还 包含 一 个 判断 语句 块 ， 不 是 独立 的 一 条 语句 。 其 他 代码 并 行 后 结果 如 下 : 


在 Python 代码 中 除了 可 以 将 “:” 语 句 单独 一 条 语句 并 行 ， 也 可 以 将 “; ”后 的 语句 进行 并 行 ， 并 支持 
连续 的 并 行 。 
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print (numl+num2) 7 

输出 结果 : 11 

在 上 述 程序 代码 中 的 第 02 行 代码 允许 并 行 到 上 行 代 码 “:; ”语句 的 后 面 。 并 行 结果 如 下 : 
numl =5;num2 =6; 

print (numl+num2); ”# 该 行 也 允许 并 到 上 一 行 

输出 结果 : 11 

在 上 述 程 序 代码 中 的 第 02 行 也 允许 并 行 到 上 行 代 码 “; ”语句 的 后 面 。 并 行 结果 如 下 : 
numl =5;num2 =6;print (numl+num2); 

输出 结果 : 11 


注意 : 在 C、Java、PHP 等 语言 的 每 一 条 语句 最 后 加 个 分 号 ， 是 语法 要 求 。 但 是 对 于 Python 语言 ， 分 
号 是 可 加 可 不 加 的 ， 因 为 Python 是 靠 换 行 来 区 分 代码 语句 的 ， 这 里 建议 最 好 还 是 不 加 分 号 。 


2.3.4 变量 与 保留 字 


在 Python 程序 中 是 通过 “变量 ”来 存储 和 标识 具体 数据 值 的 ， 数 据 的 调用 和 操作 是 通过 变量 的 名 
称 。 这 就 需要 给 程序 “变量 ”元 素 关 联 一 个 标识 符 〈 命 名 )， 并 保证 其 唯一 性 。 在 Python 中 对 “变量 ” 
命名 时 ， 需 要 遵守 一 些 命名 规则 。 违 反 这 些 规则 将 可 能 引发 程序 错误 。 请 牢记 下 述 有 关 变 量 命名 的 
规则 。 

(1) 变量 名 只 人 允许 包含 字母 (a 一 z，A 一 Z)、 数 字 和 下 画 线 。 变 量 名 可 以 以 字母 或 下 画 线 开 头 ， 但 第 一 
个 字符 不 能 是 数字 。 例 如 ， 可 将 变量 命名 为 username 或 者 userName2， 但 不 能 将 其 命名 为 2userName。 

(2) 变量 名 不 允许 包含 空格 ， 但 可 使 用 下 画 线 来 分 隔 其 中 的 单词 。 例 如 ， 变 量 名 命名 为 user_name 是 
可 行 的 ， 但 命名 为 user name 是 不 被 允许 的 ， 会 引发 错误 。 

(3) 在 Python 程序 中 对 大 小 写 是 敏感 的 。 例 如 ，usermmame 和 userName 是 不 同 的 变量 名 。 

(4) 变量 命名 应 既 简短 又 具有 描述 性 。 例 如 ，name 比 n 好 ，user name 比 un 好 。 

(5) 慎 用 小 写字 母 1 和 大 写字 母 0， 因 为 它们 可 能 被 人 错 看 成 数字 1 和 0。 另 外 ,字母 p 的 大 小 写 也 应 
慎 用 ， 不 易 区 分 。 

(6) 不 要 使 用 Python 程序 已 经 保留 用 于 特殊 用 途 的 Python 关键 字 和 函数 名 作为 变量 名 ， 如 print、if、 
for (如 下 所 示 )。 


fals none tme and as 
assert break class continue def 
del elif else except finally 
for from global if import 
in is lambda nonlocal not 

or pass Talse Tetum try 
while with yield 


“保留 字 ” 指 在 高 级 程序 语言 中 已 经 被 定义 过 的 字 ， 不 允许 使 用 者 再 将 这 些 字 作为 变量 名 或 常量 名 
使 用 。 

注意 : 编写 Python 程序 过 程 中 ,建议 使 用 小 写 的 Python 变量 名 。 在 变量 名 中 使 用 大 写字 母 虽 然 不 会 导 
臻 错误， 但 避免 使 用 大 写字 母 ， 这 样 可 以 更 利于 程序 代码 的 阅读 。 
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2.3.5 字符 串 


字符 串 表 示 的 是 文本 , 通常 是 指 要 展示 给 别人 的 或 者 是 想 要 从 程序 里 “输出 ”的 一 小 段 字 符 。 在 Python 
”中 可 以 对 文本 通过 双 引 号 〈"") 或 者 单 引 号 〈") 标注 来 识别 出 字符 串 来 。 例 如 : 
name = "python" 或 userage = '18' 
在 本 例 中 写 的 是 userage = '18'"， 所 以 userage 就 是 一 个 字符 串 。 但 是 如 果 写 的 是 userage = 18 (没有 
引号 )， 那 么 userage 就 不 是 一 个 字符 串 了 ， 而 变 成 了 一 个 整数 。 
另外 ， 在 Python 中 ， 可 以 使 用 字符 串 操 作 符 “+”( 加 号 ) 实现 两 个 字符 串 的 连接 操作 。 例 如 ， 字 符 串 
"python"+" is good! "和 "python"+" is good! "与 python is good' 所 表达 的 字符 串 的 值 是 相同 的 。 
回 


2.3.6 ”程序 分 支 语句 


在 Python 中 采用 让 elifelse 描述 多 分 支 结构 ， 是 对 上 级 下 判断 条 件 语句 为 真 值 情 况 的 二 次 判断 ， 甚 至 
多 次 判断 。 语 句 格 式 如 下 : 
if < 条 件 表达 式 1>: 
语句 块 1 
if < 条 件 表达 式 2>: 
语句 块 2 
elif < 条 件 表达 式 3>: 
语句 块 3 


else 
语句 块 4 

elif < 条 件 表达 式 4>: 
语句 块 5 

else: 


语句 块 6 
在 2.1 节 的 程序 范例 中 ， 首 先 程序 对 所 输入 的 数字 进行 与 2 整除 结果 判断 (if num%2==0)， 如 果 条 件 
满足 再 进行 与 $ 整除 结果 判断 (if num%5==0)， 最 后 程序 根据 这 两 项 判断 条 件 是 否 成 立 (为 真 ) 的 情况 ， 
给 出 所 输入 数字 被 2 或 5 整除 情况 的 字符 串 信息 。 


2.3.7 ”赋值 语句 


在 前 面 的 程序 中 运用 了 一 条 pum=int(input(" 输 入 一 个 数字 : ")) 语 句 ， 其 中 的 “=” 在 Python 中 表示 “ 赋 
值 ”， 包 含 “=” 的 语句 在 Python 中 称 为 赋值 语句 。“=” 是 一 个 赋值 符号 ， 表 示 将 “=” 右 边 的 值 赋 给 “=” 
左 侧 的 变量 ， 在 本 语句 中 表示 将 “=” 右 侧 获取 到 的 输入 数字 赋 给 左 侧 的 num 变量 。“=” 赋 值 符号 和 数学 
中 的 “=” 号 的 含义 是 不 一 样 的 。 

另外 ， 在 Python 中 还 有 一 种 是 同步 赋值 语句 ， 该 语句 可 以 同时 对 多 个 变量 赋值 〈 先 运算 右 侧 N 个 表达 
式 ， 然 后 同时 将 表达 式 结果 赋 给 左 侧 ) 语法 如 下 : 

< 变量 1>,…，< 变 量 N> 一 < 表达 式 ] >,…,，< 表 达 式 N> 

例如 : 交换 变量 x 和 y 

如 果 采 用 单个 赋值 ， 需 要 3 行 语 句 : 


>>>z = x 
>>>X =y 
>>>y = 2z 
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在 本 例 中 即 通过 一 个 临时 变量 z 先 缓存 下 x 的 原始 值 ， 然 后 将 了 值 (交换 ) 赋 给 x， 最 后 将 x 的 原始 值 
再 通过 z《〈 交 换 ) 赋值 给 y， 完 成 变量 x 和 y 值 的 交换 操作 。 

如 果 采 用 同步 赋值 语句 的 方式 ， 不 需要 借用 临时 变量 缓存 数值 ， 仅 需要 一 行 代码 即 可 : 

>>>x，y = yy x 

同步 赋值 语句 可 以 让 赋值 过 程 变 得 更 便捷 , 减少 变量 的 使 用 ,使 赋值 语句 更 简洁 易 懂 , 提高 程序 的 可 读 性 。 

另外 ， 在 Python 程序 中 ,赋值 语 句 x=y 和 y=x 的 含义 是 不 同 的 。 例 如 : 

es 

>>>X = 了 

>>>print ("x 的 值 是 : "，x) 

>>>print ("y 的 值 是 ; ",y) 

注意 : 上 述 代 码 需 要 一 行 一 行 地 输入 和 执行 ， 否 则 会 报 语法 错误 。 

在 本 例 中 , 虽然 x 的 初始 值 是 3 (在 第 1 行 中 赋值 的 ), 但 在 第 03 行 x=y 的 赋值 语句 中 又 把 y 的 值 (9) 
赋值 给 了 x， 现 在 x 的 值 已 经 由 最 初 的 3 变 成 了 9。y 的 值 没 有 被 重新 赋值 保持 不 变 。 所 以 程序 执行 输出 的 
数值 均 为 9， 如 下 所 示 。 

x 的 值 是 ，9 

Y 的 值 是 :9 

接 下 来 ， 将 范例 中 第 03 行 赋值 语句 修改 为 y=x。 范 例如 下 : 

Ete le} 

SY = 9 

>>>y = x 

>>>print ("x 的 值 是 : ",x) 

>>>print ("y 的 值 是 : ",y) 


在 数学 运算 中 通常 x = y 和 y = x 有 着 相同 的 含义 ， 然 而 在 程序 中 它们 的 含义 却 发 生 了 变化 。 在 第 03 
行 通过 y=x 的 赋值 语句 中 把 x 的 值 (3) 赋值 给 了 y， 现 在 y 的 值 已 经 由 最 初 的 9 变 成 了 3。x 的 值 没有 被 
重新 赋值 保持 不 变 。 所 以 程序 执行 输出 的 数值 均 为 3， 如 下 所 示 。 


x 的 值 是 ，3 
Y 的 值 是 ，3 


2.3.8 ”数据 输入 与 输出 


在 Python 编程 中 是 通过 Python 内 置 的 inputO 函 数 和 print() 函 数 实现 数据 的 输入 读 取 和 输出 显示 信息 的 。 
下 面 将 学 习 Python 数据 的 输入 与 输出 。 

1.input() 函 数 

inputO 函 数 可 以 让 程序 暂停 运行 ， 等 待 用 户 输入 数据 信息 。 程 序 在 获取 用 户 输入 的 信息 后 ，Python 将 
其 存储 在 一 个 变量 中 ， 以 方便 后 面 程序 的 使 用 。 

在 2.1 节 的 程序 范例 中 的 第 01 行 就 用 到 了 input0 函 数 。 

num=int (input (" 输 入 一 个 数字 : ") ) 

inputO 函 数 接受 一 个 参数 , 即 要 向 用 户 显 示 的 提示 或 说 明 , 让 用 户 知道 该 做 什么 。 在 这 个 范例 中 , Python 
运行 到 第 01 行 代 码 时 ， 用 户 将 看 到 提示 “输入 一 个 数字 : ”。 程序 等 待 用 户 输 入 数字 ， 当 用 户 完成 数字 的 输 
入 并 按 Enter 键 后 程序 才 继 续 运行 。 用 户 所 输入 数字 存储 在 变量 num 中 。 

input0 输 入 函数 的 语法 如 下 : 

< 变量 >=input (< 提示 性 文字 >) 
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在 Python 3.X 中 ，input0 函 数 获 得 的 用 户 输入 均 以 字符 串 形式 保存 在 变量 中 ， 参 见 如 下 范例 代码 。 


【 例 2-7】input0 输 入 函数 。 

>>> input_string=input ("请 输入 : ") 
请 输入 : 我 在 学 习 Python 

>>> print (input string) 

我 在 学 习 Python 

>>> input_string=input ("请 输入 : ") 
请 输入 : 2018 

>>> print (input string) 

2018 

>>> 


无 论 用 户 输入 的 是 数字 还 是 字符 ，input0 函 数 都 统一 按照 字符 串 的 类 型 输出 显示 。 在 例 2-7 的 第 06 行 


输入 2018 时 ，input0 函 数 以 字符 的 形式 输出 。 

2. print() 函 数 

print0 函 数 向 用 户 或 者 屏幕 上 输出 指定 的 字符 信息 。 在 printO 函 数 的 括号 中 加 上 字符 串 ， 就 可 以 向 
上 输出 指定 的 文字 。 例 如 输出 “hello，world”， 用 代码 实现 如 下 。 

>>> print (hello, world) 

printO 函 数 也 可 以 接受 多 个 字符 串 ， 用 逗号 “, ” 隔 开 ， 就 可 以 连 成 一 串 输出 : 


>>> print ("hello,world "，,"PYthon "，" 是 一 门 优秀 的 编程 语言 ! ") 
hello，world Python 是 一 门 优秀 的 编程 语言 ! 


printO 会 依次 打印 输出 每 个 字符 串 ， 遇 到 逗号 “, ”会 输出 一 个 空格 ， 因 此 ， 输 出 的 字符 串 是 就 是 这 样 


拼 起 来 的 。 
Print0 输 出 函数 的 语法 如 下 : 
print (value, ‘*, sep=' ', end='\n', file=sys.stdout, flush=False) 
。 参数 sep 是 实现 分 隔 符 ， 例 如 多 个 参数 输出 时 想 要 输出 中 间 的 分 隔 字 符 ; 
。 参数 end 是 输出 结束 时 的 字符 ， 默 认 是 换行 符 m; 
。 参数 file 是 定义 流 输出 的 文件 ， 可 以 是 标准 的 系统 输出 sys.stdout， 也 可 以 重 定义 为 别 的 文件 ; 


。 参数 flush 是 判断 是 否 立即 把 内 容 输 出 到 流 文件 , 不 做 缓存 (这 里 是 sys.stdout, 也 就 是 默认 的 显示 器 )。 


print0 输 出 函数 中 的 sep、end、file、flush 参数 是 4 个 可 选 参数 。 具 体 应 用 方法 如 下 。 

(1) sep 参数 : 在 输出 字符 串 之 间 插 入 指定 字符 串 ， 黑 认 是 空格 ， 范 例 代码 如 下 。 

【 例 2-8】print0 输 出 函数 中 的 sep 参数 。 

>>> print ("a","b","c", sep="$$") ”将 默认 空格 分 隔 符 修 改 为 "$$" 

assb$sc 

(2) end 参数 : 在 print 输出 语句 的 结尾 加 上 指定 字符 串 ， 默 认 是 换行 (m)， 范 例 代码 如 下 。 

【 例 2-9】print0 输 出 函数 中 的 end 参数 。 

>>> print ("a","b","c"，end="; ")  # 将 默认 空格 分 隔 符 修改 为 "; " 

abeci 

注意 : print 默认 是 换行 ， 即 输出 语句 后 自动 切换 到 下 一 行 ， 对 于 Python 3. 和 来 说 ， 如 果 要 实现 给 
换行 的 功能 ， 可 以 设置 end="" (Python 2 可 以 在 print 语句 之 后 加 “, ”实现 不 换行 的 功能 )。 


出 不 


(3) file 参数 : 指定 文本 将 要 发 送 到 的 文件 、 标 准 流 或 者 其 他 类 似 文件 的 对 象 ， 默 认 是 sys-stdout， 范 


例 代码 如 下 : 
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>>> print (1,2,3, sep='-'vend='; \n',file=open('print.txt"', "a')) # 执 行 4 次 print () 函数 


1-2-3; 
1-2-3; 
1-2-3; 
1-2-3; 


在 本 例 中 ，file=open('print.txt,'a) 设 置 了 输出 文件 路 径 ，'a' 设 置 了 打开 文件 的 方式 是 添加 模式 ， 所 以 字 
符 串 会 加 在 文件 未 尾 ， 不 会 重 写 文件 。 其 中 ，sep='-' 参 数 设置 了 字符 写 入 时 的 分 隔 符 〈-);，end='; \m' 参 数 设 
置 了 字符 写 完 后 的 结尾 符号 (; ) 及 换行 (m)。 另 外 , 执行 该 函数 会 在 Python 软件 根 目录 中 新 建 一 个 print.txt 


文本 文件 用 于 写 入 本 例 指 定 文本 ， 如 图 2-2 所 示 。 


(4) flush 参数 : flush 参数 值 为 True 或 者 False, 默认 为 False, 表示 是 否 立刻 将 输出 语句 输入 到 参数 file 


指向 的 对 象 中 默认 是 sys.stdout)， 范 例 代码 如 下 。 
【 例 2-11】print0 输 出 函数 中 的 flush 参数 。 


>>>f = open('print.txt','w') 


>>>print ('python', file=f) 4# 将 python 字符 文本 输入 到 Print .txt 文本 文件 中 
可 以 看 到 print.txt 文件 这 时 为 空 ， 只 有 执行 fclose() 之 后 才 将 内 容 写 进 文件 ， 如 图 2-3 所 示 。 


| 加 


文件 (月 妨 加 (日 。 眉 式 (0) 可 看 (V) 玫 妈 人 H) 
-2-3 


图 2-2 print.txt 文 本 文件 

在 这 里 将 file=f 参数 值 修改 为 Tme， 则 立刻 就 可 
以 看 到 指定 文件 的 输出 函数 内 容 ， 如 图 2-4 所 示 。 

>>> £ = open('print.txt','w') 

>>> print('python', file=f,flush=True) 

flush 参数 的 功能 在 客户 端 脚 本 中 几乎 用 不 上 , 多 
用 于 服务 器 端 。 例 如 , 在线 Web 即时 聊天 页 面 会 实时 
显示 聊天 的 内 容 ， 其 实 后 台 是 在 一 直 向 服务 器 请 求 数 
据 的 ， 正 常情 况 下 是 请 求 完毕 之 后 才 会 输出 相应 的 请 
求 内 容 ， 但 是 因为 是 即时 聊天 ， 就 需要 一 有 信息 响应 
就 立即 返回 ， 在 这 里 fush 也 就 起 作用 了 。 


司 princut -记事 地 幸 ，: 生 ” 基 
| 媚 句 (日 ” 林 式 (0) 查看 (V) 帮助 (H) 


图 2-3 print.txt 空 文本 文件 


司 prinuut -记事 李 = 全 
文件 (如 名 (日 。 检 式 (0) 至 看 V) 帮助 H) 


2-4 ”输出 函数 立即 写 入 print.txt 文 件 


2.4 ”就 业 面试 技巧 与 解析 


面试 官 问 : 什么 是 PEP8? 


应 聘 者 : PEP8 是 一 个 编程 规范 ， 是 可 以 使 程序 代码 整洁 美观 ， 更 具 可 读 性 的 建议 。 
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第 3 章 
数字 和 字符 串 类 型 


7 学 习 指引 


数据 类 型 是 了 解 一 门 语言 的 基础 过 程 ， 对 于 理解 语言 的 逻辑 结构 有 着 至 关 重 要 的 作用 。Python 的 基本 
数据 类 型 和 其 他 语言 一 样 ， 主 要 包括 数字 类 型 和 字符 串 类 型 ， 但 相对 于 其 他 语言 ，Python 的 数据 类 型 也 有 
其 独特 的 地 方 。 


二 ”重点 导读 


了解 变量 赋值 的 意义 。 

“掌握 基本 的 数据 类 型 间 的 区 别 。 
“掌握 数据 类 型 的 转换 。 
“掌握 基本 的 数据 操作 。 

“重点 掌握 数据 的 格式 化 操作 。 


3.1 数字 类 型 


数字 类 型 是 Python 的 基础 数据 类 型 之 一 ， 主 要 包括 整数 类 型 、 浮 点 数 类 型 和 复数 类 型 。Python 的 数据 
类 型 用 于 存储 数值 型 数据 ， 例 如 日 常生 活 中 的 整数 、 实 数 和 复数 等 。 它 们 在 赋值 存储 后 就 不 可 再 改变 了 ， 
如 果 要 改变 数值 则 必须 创建 新 的 对 象 进行 赋值 。 
5@ 


3.1.1 整数 类 型 


整数 类 型 即 对 应 现实 生活 中 的 整数 。 整 数 类 型 的 数据 包括 正 整数 、 负 整数 和 零 。 不 同 于 Python 2.X， 
在 Python 3.X 中 没有 Long (长 整 型 ) 这 个 类 型 ， 也 就 是 Python 3.X 中 的 整 型 没有 限制 。 在 Python 中 区 分 
正 整数 和 负 整 数 的 方式 和 生活 中 一 样 采用 符号 区 分 ， 如 -100、0、-3 等 。 

虽然 Python 3.X 已 经 成 为 主流 ， 但 是 依旧 可 以 了 解 下 Python 2.X 中 的 长 整 型 数据 。 为 了 标识 长 整 型 数 
据 ， 一 般 在 数据 未 尾 添 加 大 写 或 小 写 的 工 (通常 情况 下 小 写 L 和 数字 1 不 易 区 分 ， 因 此 常用 大 写 的 L)， 如 
5623656L。 
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为 了 方便 计算 和 书写 ，Python 中 整数 可 以 用 多 种 不 同 的 进 制 方式 书写 ， 其 格式 为 0+ 进 制 方式 (通常 为 
个 大 写字 母 ) + 相应 进 制 的 数据 。 具 体格 式 如 表 3-1 所 示 。 


表 3-1 进 制 格式 
进 制 方式 进 制 说 明 
二 进 制 对 应 二 进 制 整数 
八进制 对 应 八进制 整数 ， 其 数字 部 分 范围 为 0~7 
十 进 制 对 应 十 进 制 整数 ， 其 数字 部 分 范围 为 0~9 
十 六 进 制 对 应 十 六 进 制 整数 ， 其 数字 部 分 范围 为 0~9 和 A~F 


3.1.2 ”整数 的 按 位 运算 


按 位 运算 仅 对 整数 存在 意义 。 按 位 运算 结果 的 计算 如 同 二 进 制 补 码 的 计算 ， 用 于 计算 有 限 位 数 的 整数 。 
理解 上 是 对 整数 逐 位 的 操作 ， 其 主要 操作 类 型 和 操作 类 型 如 表 3-2 所 示 。 


表 3-2 ” 按 位 运算 操作 符 


操作 操 作 符 
与 运算 & 
或 运算 | 
异 或 运算 ^ 
左 移 运算 << 
右 移 运算 >> 
取 反 运 算 ~ 


【 例 3-1] 运算 符 。 

>>> a = 0b10101 

>>> b = 0b11011 

#31 的 二 进 制 表示 为 11111 

>>> print (alb) 

31 

#17 的 二 进 制 表示 为 10001 

>>> print (agb) 

17 

#14 的 二 进 制 表示 为 1110 

>>> print (a^b) 

14 

对 于 左 移 和 右 移 运算 符 ， 其 格式 为 a << 或 >> b， 含 义 为 将 数字 a 的 二 进 制 位 数 左 移 或 右 移 b 位 。 
【 例 3-2】 移 位 运算 。 

>>> print (a<<2) 

84 

>>> print (a<<1) 

42 

>>> print (a>>1) 

10 

对 于 这 些 常 见 的 位 运算 其 中 有 几 个 要 点 需要 注意 。 
(1) 负数 的 移 位 计数 为 非法 操作 ， 其 可 能 导致 ValueError 错误 。 
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(2) 左 移 位 ， 低 位 空缺 补 零 ， 高 位 溢出 舍弃 ， 右 移 位 ， 高 位 空缺 补 零 ， 低 位 溢出 舍弃 。 
(3) 左 移 W 位 相当 于 将 数 乘 以 2 的 六 次 壤 ， 右 移 位 相当 于 将 数 除 以 2 的 入 次 露 。 
(4) 对 于 整 型 数据 的 操作 ， 实 际 上 都 是 对 其 补 码 的 操作 (Python 2.X 中 Long 型 的 补 码 相 当 于 其 补 码 符 


号 位 无 限 拓展 )。 
(5) 位 运算 符 和 普通 运算 符 一 样 存在 优先 级 ， 其 优先 级 由 低 到 高 为 : 
>> << & A 1 
低 高 


取 反 运算 符 > 左 移 运算 符 > 右 移 运算 符 > 按 位 与 运算 符 > 按 位 异 或 运算 符 > 按 位 或 运算 符 


3.1.3 ” 浮 点 数 


浮 点 数 相对 于 整数 存在 小 数 点 ， 由 整数 和 小 数 部 分 组 成 。 浮 点 数 的 写法 除了 日 常 写 法 外 ， 常 见 的 还 包 


括 科学 计数 法 写法 ， 例 如 ，3el4 代表 3 x 10^3。 


注意 : 浮 点 数 的 0.0 和 整数 的 0 在 逻辑 运算 上 虽然 含义 是 一 样 的 ， 但 是 在 Python 中 它们 的 存储 位 置 却 


是 不 同 的 ， 实 例如 下 。 


【 例 3-3】 浮 点 数 存储 位 置 。 
>>> 汉王 :位 

>>> b = 0.0 

>>> print (id(a)) 
140724725470208 

>>> print (id(b)) 
2112409287704 


3 1 4 复数 类 型 


复数 类 型 对 应 英文 Complex， 复 数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 生活 中 的 方式 a+bj 格式 表示 ， 


或 者 用 complex(a,b) 表 示 ，j 可 大 写 也 可 小 写 。 
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【 例 3-4】 复 数 运算 。 

>>> A = 3+4j 

>>> B= -2459 

>>> A+B 

(5+9j) 

>>> A = 3+4J 

>>> B = 2+5J 

>>> A+B 

(5+9j) 

复数 的 实 部 的 内 建 属性 为 real， 复 数 的 虚 部 的 内 建 属性 为 imag， 可 用 于 输出 复数 的 实 部 和 虚 部 部 分 。 
【 例 3-5】 复 数 的 实 部 与 虚 部 。 
>>> A = T8231 

>>> A.real 

78.0 


>>> A.imag 
23.0 


从 实 部 和 虚 部 的 输出 格式 可 以 清楚 地 看 到 复数 的 实 部 a 和 虚 部 b 都 是 以 浮 点 型 数据 进行 存储 的 。 
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3.1.5 布尔 类 型 


布尔 类 型 严格 意义 上 来 讲 不 算数 字 类 型 ， 但 是 作为 Python 的 基本 数据 类 型 之 一 ， 还 是 需要 了 解 和 掌 
握 的 。 

布尔 类 型 只 存在 两 种 值 : True 和 False。 布 尔 类 型 支持 常规 的 运算 ， 例 如 与 运算 、 或 运算 和 非 运算 。 

【 例 3-6】 布 尔 运算 。 

>>> A = TIue 

>>> B = False 

>>> AIB 

True 

>>> A&B 

False 

>>> not A 

False 

>>> not B 

True 

和 其 他 语言 一 样 ，Python 中 的 True 和 False 同样 可 以 和 1 与 0 等 价 进行 常规 运算 。 

【 例 3-7】 特 殊 布尔 运算 。 

>>> A = True 

>>> B = False 

>>> A+l 

2 

>>> B+1 

1 

>>> A+B 

Eb 


3.2 ”数字 类 型 的 操作 


在 3.1 节 中 了 解 了 数字 类 型 包括 整数 类 型 、 整 数 的 按 位 运算 、 浮 点 数 、 复 数 类 型 和 布尔 类 型 。 那 么 在 
一 节 中 将 学 习 数 字 类 型 的 基本 操作 方法 。 


3.2.1 内置 的 数值 操作 符 

在 Python 中 ， 内 置 的 操作 运算 符 主要 分 为 四 种 ， 分 别 是 算术 运算 符 、 赋 值 运算 符 、 逻 辑 运算 符 和 关系 
运算 符 。 其 实例 分 别 如 下 。 

1. 算术 运算 符 

算术 运算 符 如 表 3-3 所 示 。 


洲 


表 3-3 算术 运算 符 


描述 及 等 价 转换 
两 个 对 象 相 加 
得 到 负数 或 是 一 个 数 减 去 另 一 个 数 

两 个 数 相 乘 或 是 返回 一 个 被 重复 若干 次 的 字符 串 
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续 表 
运 算 符 运算 符 描述 描述 及 等 价 转换 
/ 除法 运算 义 除 以 Y 
% 取 模 运算 返回 除法 的 余数 
加 需 运 算 A++B 代表 和 A 的 B 次 方 
1 整除 运算 取 整 除 ， 返 回 商 的 整数 部 分 (向 下 取 整 ) 
具体 使 用 及 输出 如 下 。 
【 例 3-8】 算 术 运 算 。 
>>> 及 = 2 
>>> B=3 
>>> A**B 
8 
>>> A*B 
6 
>>> B/A 
5 
>>> B//A 
| 
>>> ASB 
2 
>>> A+B 
上 
>>> A-B 
Sf 
2， 赋 值 运 算 符 
赋值 运算 符 如 表 3-4 所 示 。 
表 3-4 赋值 运算 符 
运 算 符 运算 符 描述 描述 及 等 价 转换 
= 赋值 运算 符 C=A+B 将 A+B 的 运算 结果 赋值 为 C 
4 加 法 赋值 运算 符 A+=B->A=A+B 
-3 减法 赋值 运算 符 A—B->A=A-B 
4 乘法 赋值 运算 符 A*=B->A=A*B 
请 除法 赋值 运算 符 A/=B->A=A/B 
%= 取 模 赋值 运算 A%=B->A=A%B 
4 一 朝 赋 值 运 算 符 A**B->A=A**B 
全 取 整 除 赋值 运算 符 A//=B->A=A//B 
具体 使 用 及 输出 如 下 。 


【 例 3-9】 赋 值 运算 。 
>>>A=8 

>>> print (A) 

8 

>>> A+= 8 

>>> print (A) 
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注意 : 除法 运算 结果 为 浮 点 数 ， 和 被 除数 与 除数 的 类 型 无 关 。 
3. 逻辑 运算 符 
逻辑 运算 符 如 表 3-5 所 示 。 


表 3-5 ”逻辑 运算 符 


逻辑 运算 主要 与 布尔 值 的 判断 和 0、1 操作 有 关 。 
【 例 3-10】 逮 辑 运 算 。 
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4. 比较 运算 符 
比较 运算 符 如 表 3-6 所 示 。 
表 3-6 ”比较 运算 符 
运 算 符 运算 符 描述 描述 及 等 价 转换 
一 等 于 判断 两 个 操作 数 是 否 相等 
= 不 等 于 判断 两 个 操作 数 是 否 不 相等 
汉 大手 判断 左 侧 操作 数 是 否 大 于 右 侧 操作 数 
党 等 于 判断 左 侧 操作 数 是 否 小 于 右 侧 操作 数 
~ 不 等 于 判断 两 个 操作 数 是 否 不 相等 
= 大 于 等 于 判断 左 侧 操作 数 是 否 不 大 于 等 于 右 侧 操 作 数 
5 小 于 等 于 判断 左 侧 操作 数 是 否 不 小 于 等 于 右 侧 操作 数 
【 例 3-11】 比 较 运 算 。 
>>> A=3 
> 到 1 之 
>>> R == B 
False 
>>> A != B 
True 
>>>A>B 
True 
>>>A<B 
False 


>>>A >= B 
True 

>>> R <= B 
False 


3.2.2 ”内置 的 数值 运算 函数 
内 置 的 数值 运算 函数 如 表 3-7 所 示 。 


表 3-7 ”内置 的 数值 运算 函数 


函数 功能 描述 


abs(A) 返回 数字 A 的 绝对 值 ， 若 A 为 复数 则 返回 复数 A 的 模 

bool(A) 返回 与 A 等 价 的 布尔 值 〈True/False) 

complex(real.[imag]) 返回 此 构造 的 复数 

id(A) 返回 对 象 A 的 内 存 地 址 标识 

int(ALAD 返回 实数 , 分 数 或 者 高 精度 实数 A 的 整数 部 分 , 或 把 d 进 制 的 字符 串 A 转换 为 十 进 制 并 返回 ， 


d 默认 为 十 进 制 


Iound(A[. 小 数位 数 ]) 对 人 A 四 舍 五 入 ， 若 未 指定 小 数 的 位 数 ， 则 返回 整数 


pow(Gx，y[ 计算 x 的 y 次 方 并 对 结果 进行 z 取 模 ， 等 价 为 pow(x.y)%z 
部 分 函数 操作 及 其 具体 用 法 示例 如 下 。 
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【 例 3-12】 函 数 运算 。 

>>> abs (A) 

352.565 

>>> A = -1542.11 

>>> abs (A) 

1542.11 

函数 bool () 如 果 内 容 缺 省 则 会 返回 False; 当 传 入 内 容 为 字符 囊 时 ， 若 字符 串 部 位 为 空 返回 False, 不 为 空 则 返回 Truey 
传 入 的 若 为 数字 1 或 者 0 则 会 返回 对 应 的 布尔 值 。bool () 函数 操作 对 象 也 可 以 是 判断 语句 和 计算 式 。 

>>> bool(1) 

True 

>>> bool (0) 

False 

>>> bool (1==2) 

False 

>>> bool(5-5) 

False 

常见 的 函数 操作 中 ， 部 分 函数 的 用 法 需要 特殊 记忆 。 下 面 列举 的 函数 其 用 法 虽然 不 广泛 ， 但 是 对 于 理 
解 Python 的 数据 类 型 和 存储 有 着 较为 直观 的 意义 。 

(1) 函数 round0 与 精度 误差 。 

函数 round () 的 作用 为 将 浮 点 数 A 进行 四 舍 五 入 ， 并 指定 小 数 的 位 数 。 关 于 舍 入 需要 知道 Python 中 浮 
点 数 的 特征 。 

浮 点 数 本 身 就 是 非 精确 数据 。 大 多 数 十 进 制 小 数 并 不 能 完全 用 二 进 制 小 数 来 表示 。 因 此 ， 输 入 的 十 进 
制 浮 点 数 一 般 只 能 用 二 进 制 浮 点 数 来 进行 近似 。 

例如 在 十 进 制 中 ， 对 于 分 数 /3， 将 其 写成 小 数 时 只 能 无 限 近 似 写 成 1.333…， 同 理 ， 在 面 对 十 进 制 浮 
点 小 数 例如 0.1 时 ， 无 法 将 其 完美 地 换算 为 二 进 制 数据 ， 只 能 无 限 近 似 。Python 中 存在 一 个 近似 策略 ， 用 
户 面 对 的 屏幕 输出 的 十 进 制 数值 仅 是 被 输出 的 一 个 近似 值 ， 其 真实 的 值 以 二 进 制 数值 存储 在 机 器 上 。 上 述 
情况 告诉 我 们 ，Python 以 舍 入 形式 进行 数据 的 近似 管理 。 

round() 函 数 在 使 用 上 实际 上 也 很 简单 。 

【 例 3-13】round0 函 数 。 

>>> round(536.4525632232,3) 

536.453 

这 和 人 们 认 知 中 的 小 数 近似 结 果 一 致 ， 即 四 舍 五 入 ， 但 是 有 时 候 考虑 到 前 面 提 到 的 存储 情况 时 就 会 出 
现 另 一 种 状况 。 

【 例 3-14】zround0 函 数 精度 。 

>>> round(2.675,2) 

2.67 

>>> Found(0.66666675,7) 

0.6666667 

可 以 清楚 地 看 到 ， 这 似乎 违背 了 四 舍 五 入 的 基本 法 则 ， 实 际 上 这 是 由 于 计算 机 只 能 采用 近似 储存 浮 点 
数 ， 导 致 精度 误差 所 致 。 官 方 文档 存在 下 列 说 明 : 

The behavior of round() for floats can be surprising: for example, round(2.675, 2) gives 2.67 
instead of the expected 2.68. This is not a bug: it’s a result of the fact that most decimal fractions 
Can’t be represented exactly as a float. See Floating Point Arithmetic: Issues and Limitations for 
more information. 


可 以 得 知 数据 在 近似 转换 为 0、1 储存 时 被 进行 了 截断 处 理 ， 因 此 导致 了 精度 误差 ， 为 此 round0 近 似 
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函数 实际 上 只 能 进行 对 精度 要 求 不 大 的 近似 求 值 。 关 于 精确 计算 ，Python 提供 了 其 他 选择 ， 例 如 后 续 将 要 
学 到 的 math 模块 中 的 ceiling 方法 和 将 要 介绍 的 decimal 模块 。 
(2) pow0 函 数 的 使 用 。 
pow(x.y[.z]) 函 数 看 似 等 价 于 (x**y)9%6z。 
【 例 3-15】pow0 函 数 。 
>>> pow(4,3) 
64 
>>> pow(4,3,4) 
0 
>>> pow(4,3,5) 
4 


但 是 实际 上 ， 它 们 并 不 完全 等 价 。 
【 例 3-16】 特 殊 pow0 函 数 。 


>>> pow(4,2.6,2.1) 
Traceback (most recent call last): 
File "<pyshell#75>", line 1, in <module> 
pow(4,2.6,2.1) 
TypeError: pow() 3rd argument not allowed unless all arguments are integers 


可 知 ，Python 不 允许 第 三 个 操作 数 为 浮 点 数 ， 这 与 x**y%z 存在 差异 ， 可 知 在 使 用 上 并 不 完全 等 价 。 


3.2.3 ”内置 的 数字 类 型 转换 函数 
内 置 的 数字 类 型 转换 函数 如 表 3-8 所 示 。 
表 3-8 内置 的 数字 类 型 转换 函数 


函数 功能 描述 
ascii(obj) 返回 一 个 可 打印 的 对 象 字符 串 方式 表示 ， 如 果 是 非 ascii 字符 就 会 输出 w，\u 或 \U 等 字符 来 表示 
int[bas) | 将 x 转 的 为 ~ 人 到 
float(x[,base]) 将 x 转换 为 一 个 浮 点 数 
complex(real,[imag]) | 返回 此 构造 的 复数 
ord(x) 将 x 转换 为 十 进 制 数 
hex(x) 将 x 转换 为 十 六 进 制 数 
oct(x) 将 x 转换 为 八进制 数 
函数 使 用 举例 如 下 。 


【 例 3-17】asciiO 函 数 。 

asciiO 函 数 类 似 Python 2.X 中 的 repr0 函 数 ， 结 果 为 返回 这 个 指定 可 打印 对 象 的 字符 串 表 示 ， 如 果 此 对 
象 为 非 ascii 字符 就 以 转 义 字符 型 输出 Wx,\u 等 )， 例 如 中 文字 符 串 ， 具 体 实例 如 下 。 

>>> ascii (A) 

,33， 

>>> ascii('A') 

wan 

>>> ascii ("中 文 ") 

"'\\u4e2d\\u6587'" 

>>> bin(65) 

'0b1000001" 
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>>> oct (34) 

'0042' 

>>> hex(34) 

W0322" 
其 中 ， 函 数 int(x[,base]) 和 函数 float(x[,base]) 内 的 第 二 个 参数 的 含义 通过 以 下 实例 来 解释 。 

【 例 3-18】int0 函 数 。 

>>> int("20",8) 

16 

>>> int ("0x64AFO0",16) 

412400 

>>> int ("006424",8) 

3348 

通过 实例 可 以 知道 ， 参 数 base 的 作用 是 指定 第 一 个 参数 的 进 制 类 型 。 此 时 的 x 参数 不 可 为 数字 ， 只 能 
为 字符 串 、 数 组 或 者 将 要 学 到 的 数组 列表 类 型 。 

base 默认 为 十 进 制 ， 当 指定 为 8 时 是 八进制 ,为 16 时 是 十 六 进 制 等 ， 但 注意 当 其 为 0 的 时 候 ， 依 旧 表 
示 十 进 制 。 

对 于 函数 complex(real,[imag])， 其 实例 如 下 。 

【 例 3-19】complex0 函 数 。 

>>> complex (10,20) 

(10+20j) 

>>> complex (10+2,20+2) 

(12+22j) 

>>> complex (102) 

(102+0j) 

>>> complex () 

0 
可 知 参数 real 和 imag 也 可 以 为 计算 式 ， 如 果 第 一 个 参数 是 一 个 字符 串 ， 它 将 被 解释 为 一 个 复数 ， 并 且 
必须 在 没有 第 二 个 参数 的 情况 下 调用 该 函数 。 第 二 个 参数 不 可 以 为 字符 串 。 每 个 参数 可 以 是 任何 数字 类 型 
(包括 复数 )。 如 果 省 略 imag， 则 默认 为 零 ， 构 造 函数 用 作 int 和 float 之 类 的 数字 转换 。 如 果 省 略 两 个 参数 ， 
则 返回 0j。 


3.3 ”字符 串 类 型 


仅 有 数字 类 型 在 日 常生 活 中 显然 是 不 够 的 ， 为 了 更 方便 地 对 文本 数据 和 对 象 进行 处 理 ，Python 中 引入 
了 我 们 在 其 他 语言 也 熟悉 的 数据 类 型 一 一 String。 


3.3.1 字符 串 的 定义 


在 创建 字符 串 时 ， 需 要 用 引号 来 进行 声明 。Python 提供 了 单 引 号 、 双 引号 、 三 引号 三 种 方式 来 定义 字 
符 串 。 实 例如 下 。 

【 例 3-20】 单 引号 定义 字符 串 。 

>>> A = "didj563， 

>>> print (A) 

didj563 

>>> A = "didj563" 
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we 


>>> print (A) 


didj563 

>>> A = '''didj563''" 
>>> print (A) 

didj563 


另外 ，Python 还 允许 引号 间 的 嵌 套 ， 例 如 ， 单 引号 可 被 嵌 套 进 双 引 号 。 同 时 这 种 多 引号 的 表达 方式 还 
可 以 解决 某 些 书写 的 兼容 问题 。 

【 例 3-21】 双 引号 定义 字符 串 。 

>>> A = "That's my book!”" 

>>> print (A) 

That's my book! 

>>> A = 'That's my book!' 

SyntaxError: invalid syntax 

在 此 实例 中 英语 书写 语句 中 的 ' 被 双 括 号 兼容 但 是 却 被 单 引号 错误 识别 。 因 此 在 实际 使 用 中 ， 即 使 引号 
间 没 有 区 别 ， 还 是 需要 根据 实际 使 用 情况 进行 选择 。 

另外 ， 三 引号 的 使 用 方法 也 较为 特殊 ， 三 引号 允许 换行 ， 输 出 自动 多 行 拼接 。 但 是 单 引 号 和 双 引 号 就 
不 允许 换行 ， 实 例如 下 。 

【 例 3-22】 三 引号 定义 字符 串 。 

>>> A = '''fhdjvsdv1652 

4689546dfe''' 

>>> print (A) 

fhdjvsdv1652 

4689546dfe 

>>> A = "jfneikfj54575 

SyntaxError: EOL while scanning string literal 

在 字符 串 的 定义 过 程 中 ， 也 可 能 遇 到 如 下 情况 

>>> A = "diee\nwd" 

>>> print (A) 

diee 

wd 

可 以 看 到 ， 字 符 捉 被 从 中 间 换行 了 。 这 就 是 接 下 来 要 介绍 的 “ 转 义 字符 ”。 

在 上 述 实 例 中 ，\n 为 转 义 字符 ， 代 表 换 行 。Python 的 常见 转 义 字符 及 其 含义 如 表 3-9 所 示 。 


表 3-9 转 义 字符 
转 义 字符 功能 找 述 
V 当 位 于 末尾 时 代表 转 接 下 一 行 纵向 制 表 
\ 反 和 斜 杠 符号 横向 制 表 
角 单 引号 符号 回 车 
双 引 号 符号 换 页 
\a 响 铃 空 
vb 退 格 BackSpace 八进制 数 ， 其 中 ，y 代表 字符 
\ 转 义 十 六 进 制 数 ， 其 中 ，yy 代表 字符 
换行 


转 义 字符 在 书写 格式 上 提供 了 很 大 的 便利 性 ， 但 是 如 果 并 不 想 让 转 义 字符 对 应 的 字符 起 作用 ， 而 是 单 
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纯 的 正常 显示 ， 可 以 在 字符 串 前 加 上 或 者 将 转 义 字符 的 \ 用 \ 蔡 换 。 实 例如 下 。 
【 例 3-23】 屏 蔽 字符 。 
>>> A = "per\nfect" 
>>> print (A) 
per 
fect 
>>> A = rT"per\nfect” 
>>> print (R) 
per\nfect 
>>> A = "per\\nfect” 
>>> print (A) 
per\nfect 


3.3.2 ”字符 串 格 式 化 


不 同 于 数字 类 型 的 操作 ， 字 符 串 的 操作 更 加 多 样 化 ， 和 其 他 语言 一 样 ， 字 符 串 的 基本 操作 一 一 格式 化 
输出 ， 依 旧 是 重点 。 格 式 化 输出 是 计算 机 语言 必 不 可 少 的 部 分 。 

格式 符 存 在 的 目的 是 为 真实 值 进 行 占 位 , 方便 控制 显示 输出 的 格式 。 格式 符 主要 有 以 下 类 别 , 如 表 3-10 
所 示 。 


表 3-10 格式 化 操作 符 


格式 化 操作 符 功能 描述 格式 化 操作 符 功能 描述 


%s 格式 化 字符 趾 用 科学 计数 法 格式 化 浮 点 数 ，e 为 基底 
Ye 格式 化 单个 字符 同上 
Y 浮 点 
a 格式 化 十 进 制 整数 和 (相当 于 %f 
Yu 格式 化 无 符号 数 同上 
%o 格式 化 无 符号 八进制 数 用 十 六 进 制 数 格式 化 变量 的 地 址 
Vx 格式 化 无 符号 十 六 进 制 数 字符 % 
加 格式 化 浮 点 数 [| 


对 Python 的 输出 可 以 进一步 进行 控制 ， 采 用 如 下 方式 。 
%[ (name)] [flags] [width] . [precision]typecode 

其 格式 含义 如 下 。 

名 [命名 ] [对 齐 方式 ] [显示 宽度 ] . [小 数 点 后 精度 ] 格 式 化 操作 符 
其 中 的 格式 参数 内 容 如 下 。 

e name: 命名 可 以 选择 ， 用 于 指定 key。 

。 flags: 对 齐 方 式 , 表示 右 对 齐 ， -表示 左 对 齐 , 0 表示 用 0 填充 ， 若 为 空格 则 表示 正 数 左 侧 填充 空格 。 
。 width: 显示 宽度 。 

。 precision: 小 数 点 后 精度 。 

。 typecode: 格式 化 操作 符 。 

具体 实例 如 下 。 

【 例 3-24】 格 式 化 输出 数值 。 


>>> print ("%10.3f" % 10) 
10.000 
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>>> print ("$04d" $ 6) 

0006 

>>> print ("%16.3f" % 3.3) 
3.300 


Python 中 内 置 的 % 操 作 符 可 用 于 格式 化 字符 串 操 作 ， 控 制 字符 串 的 输出 。Python 中 还 有 其 他 的 格式 化 
字符 串 的 方式 ， 但 % 操 作 符 是 最 基础 最 方便 的 。 
他 的 还 有 在 后 面 将 会 讲 到 的 format0 方 法 。 


3.3.3 ”字符 串 内 置 的 函数 


Python 为 字符 串 操作 提供 了 全 面 而 多 样 的 内 置 函 数 ， 涉 及 字符 串 的 替换 、 删 除 、 复 制 、 拼 接 、 比 较 和 
查找 等 各 个 方面 。 下 面 来 了 解 部 分 常用 的 函数 。 

(1) 字符 串 的 搜索 和 替换 。 

包括 以 下 内 置 的 函数 ， 如 表 3-11 所 示 。 


表 3-11 ”字符 串 的 搜索 和 替换 的 内 置 函 数 


函数 功能 描述 
name.capitalize() 首 字 母 大 写 
name.count('x') 查找 某 字符 x 在 字符 串 内 出 现 的 次 数 
name.find('x') 查找 字符 x 在 字符 串 内 第 一 次 出 现 的 位 置 ， 返 回 其 下 标 ， 如 不 存在 返回 -1 
name.index('x') 查找 字符 x 在 字符 串 内 第 一 次 出 现 的 位 置 ， 返 回 其 下 标 ， 如 不 存在 则 报错 
name.replace(oldstr, newstr) 查找 替换 ， 以 newstr 替换 oldstr 
使 用 范例 如 下 。 


【 例 3-25】 字 符 串 替换 函数 。 
>>> A = "duidjbvhaokkkkncad" 
>>> print (A.capitalize()) # 首 字母 大 写 
Duidjbvhaokkkkncad 
>>> print (A.count ("k")) # 查 找 k 在 字符 串 中 第 一 次 出 现 的 位 置 
4 
>>> print (A.find("i")) # 查 找 i 在 字符 串 中 第 一 次 出 现 的 位 置 
2 
>>> Print(RA.index("i")) 
2 
>>> print (A.find("z")) 
2 
>>> Print (A.index("z")) 
Traceback (most recent call last): 

File "<pyshell#10>", line 1, in <module> 

print (A.index ("z")) 

ValueError: substring not found0 
>>> print (A.replace ("k","z")) # 用 替换 掉 字 符 束 内 部 的 kk 
Duidjbvhaozzzzncad 


需要 注意 的 是 ， 字 符 串 的 位 置 查找 返回 的 下 标 中 ， 字 符 串 第 一 个 字符 的 下 标 被 定义 为 0。 
(2) 字符 串 去 空格 。 
字符 串 去 空格 的 函数 如 表 3-12 所 示 。 
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表 3-12 字符 串 去 空格 的 函数 


函数 功能 描述 
name.stripO) 去 掉 字 符 串 中 的 空格 和 换行 符 
name.strip('x') 去 掉 指定 字符 或 字符 趾 
name .lstrip('x') 去 掉 字符 串 左边 的 空格 和 换行 符 
namexstrip(x) 去 掉 字符 串 右边 的 空格 和 换行 符 


因为 方法 简单 ， 故 不 再 列举 实例 。 
(3) 字符 串 判 断 。 
字符 串 判 断 的 函数 如 表 3-13 所 示 。 


表 3-13 ”字符 串 判断 的 函数 


函数 功能 描述 
name.isalnum() 判断 字符 串 是 否 全 部 为 字母 和 数字 ， 并 且 不 为 空 
name.isalpha() 判断 字符 串 是 否 全 部 为 字母 ， 并 且 不 为 空 
name .isdigit() 判断 字符 串 是 否 全 部 为 数字 ， 且 不 为 空 
name.isspace() 判断 字符 串 是否 全 部 为 空白 字符 
name.islower() 判断 字符 串 是 否 全 部 为 小 写字 母 
name.isupper() 判断 字符 串 是 否 全 部 为 大 写字 母 
name istitle() 判断 字符 串 是 否 首 字母 大 写 


(4) 字符 串 的 分 割 截取 。 

【 例 3-26】 字 符 串 分 割 截取 。 

#name .split () 函数 默认 以 空格 进行 分 割 字符 串 
>>> A = "djuf dhwd dwb" 

>>> A.split() 

['djuf', 'dhwd', 'dwb'] 

# 也 可 以 进行 指定 标识 分 割 

>>> A = "djuf,dhwd,dwb" 

>>> A.split(",") 

['djuf', 'dhwd', 'dwb'] 

>>> A = "djufldhwdldwb" 

>>> A.split ("1") 

['djuf', 'dhwd', 'dwb'] 

(5) 字符 串 的 拼接 。 

Pyhton 提供 了 strjoin0 方 法 来 进行 字符 串 的 拼接 操作 。 实 例如 下 。 
【 例 3-27】 字 符 串 拼接 。 

>>> A = ['Hello',’ ','World','!'] 
>>> print ('' .join(A)) 

Hello World! 


3.4 ”字符 串 格 式 化 进 阶 一 一 format 


Python 的 字符 串 格式 化 主要 有 两 种 方式 : % 格 式 符 方式 和 format 方式 。 在 3.3 节 中 已 经 介绍 了 % 格 式 符 
方式 ， 那 么 在 本 节 中 将 主要 学 习 format0 方 法 ， 通 过 一 些 实例 来 加 深 读者 对 format0 方 法 的 了 解 。 
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3.4.1 format() 方 法 


从 Python 2.6 开始 ， 新 增 了 一 个 格式 化 字符 串 的 函数 format0， 它 增强 了 字符 串 格式 化 的 功能 。 
相对 于 前 面 学 到 的 基础 的 格式 化 方法 ， 此 方法 通过 全 和 :来 代替 传统 % 格 式 化 方式 。format0 既 能 够 用 
于 简单 的 场景 ， 也 能 够 胜任 复杂 的 字符 串 蔡 换 ， 而 无 需 烦 琐 的 字符 串 连 接 操作 。Python 的 内 置 类 型 str 和 
unicode 均 支持 使 用 format0 来 格式 化 字符 串 。 
接 下 来 就 详细 地 讨论 format0 的 具体 用 法 。 
其 格式 化 方法 格式 如 下 : 
[[fill]align] [sign] [#] [0] [width] [,][.precision] [type] 
其 参数 含义 如 下 。 
。 全， 可 选项 ， 用 于 填充 空白 处 的 字符 。 
。 align: 选项 ， 定 义 对 齐 的 方式 。 通 常 和 参数 width 一 起 使 用 ， 其 方式 定义 如 下 。 
。 <: 采用 左 对 齐 方式 。 
。 >: 采用 右 对 齐 方 式 ， 此 方式 为 默认 采用 的 方式 。 
。 =: 采用 右 对 齐 ， 且 将 符号 位 放 在 填充 字符 的 左 侧 ， 只 对 数字 类 型 有 效 。 
* ^: 进行 居中 对 齐 。 
。 sign: 可 选项 ， 决 定数 字符 号 相关 。 
* +: 正 号 表示 正 数 加 正 号 ， 负 数 加 负 号 。 
* -: 正 数 符号 不 变 ， 负 数 加 上 负 号 ， 此 方式 为 默认 采用 的 方式 。 
* 空格 ， 正 数 加 空格 ， 负 数 加 负 号 。 
#: 可 选项 ， 显 示 进 制 ， 如 果 对 二 进 制 、 八 进 制 、 十 六 进 制 加 上 #， 会 显示 0b/0o/0x， 否 则 不 显示 。 
，: 可 选项 ， 用 于 给 数字 添加 数学 分 隔 符 ， 例 如 40,000。 
width: 可 选项 ， 格 式 化 占有 宽度 。 
.precision: 可 选项 ， 指 定 小 数 点 要 保留 的 精度 。 
type: 可 选项 ， 格 式 化 类 型 符号 。 


3.4.2 format() 方 法 的 实例 


format() 函 数 采 用 {} 和 :进行 格式 化 ， 实 例如 下 。 
【 例 3-28】 填 充 和 格式 化 。 


>>> "{0:*>10}".format (6) # 右 对 齐 
机 于 证 虽说 

>>> "{0:*<10}".format (6) # 左 对 齐 
于 市 砷 下 于 让 中 看 

>>> "{0:*^10}".format (6) 才 居 中 对 齐 
于 全 机 证 刘 上 


【 例 3-29】 精 度 与 进 制 。 
>>> "{0:.3fj".format (1/7) 
"0.143， 

# 格 式 化 为 二 进 制 

>>> "{0:b}".format (100) 
"1100100" 

# 格 式 化 为 十 六 进 制 

>>> "{0:x}".format (100) 
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格式 化 为 八进制 

>>> "{0:0}".format (100) 

4” 

format() 允 许 参 数位 置 可 以 自由 化 ， 通 过 相应 的 参数 值 来 进行 对 应 ， 实 例如 下 。 
【 例 3-30】 位 置 对 应 。 

>>> A = ["World","Life"] 

>>> "This is our {},this is my {}".format (*A) 
"This is our World,this is my Life' 

>>> "This is our {1},this is my {0}".format (*A) 
"This is our Life,this is my World' 

>>> "This is our {0},this is my {1}".format (*A) 
"This is our World,this is my Life' 

>>> "This is our {1},this is my {00}".format (+R) 
"This is our Life,this is my World' 

>>> "This is our {1},this is my {0}{0}".format (*A) 
"This is our Life,this is my WorldWorld' 


3.5 ”就业 面试 技巧 与 解析 


本 章 学 习 了 数字 类 型 和 字符 串 类 型 。 数 字 类 型 包括 整数 类 型 、 整 数 的 按 位 运算 、 浮 点 数 、 复 数 类 型 和 
布尔 类 型 。 在 字符 串 类 型 中 学 习 了 字符 串 的 定义 、 字 符 串 的 格式 化 和 字符 捉 内 置 的 函数 和 方法 。 学 习 了 这 
些 知 识 ， 还 要 学 会 灵活 运用 这 些 知识 ， 下 面 来 看 一 下 在 面试 中 会 问 到 哪些 知识 点 。 


3.5.1 面试 技巧 与 解析 (一) 


面试 官 : format() 方 法 的 优点 有 哪些 ? 

应 聘 者 : 

(1) 无 须 理 会 数据 类 型 的 问题 ， 在 % 方 法 中 %s 只 能 替代 字符 串 类 型 。 
(2) 单个 参数 可 以 多 次 输出 ， 参 数 顺 序 可 以 不 相同 。 

(3) 填充 方式 十 分 灵活 ， 对 齐 方式 十 分 强大 。 


3.5.2 面试 技巧 与 解析 〈 二 ) 


面试 官 : Python 为 何 会 出 现 中 文 乱码 ? 

应 聘 者 : 在 Python 中 提 到 unicode， 一 般 指 的 是 unicode 对 象 ， 而 str 是 一 个 字 节 数组 ， 这 个 字 节 数 组 
表示 的 是 对 unicode 对 象 编码 (可 以 是 utf8、gbk、cp936、GB2312) 后 的 存储 的 格式 。 这 里 它 仅仅 是 一 个 
字 节 流 ， 没 有 其 他 的 含义 ， 如 果 想 使 这 个 字 节 流 显示 的 内 容 有 意义 ， 就 必须 用 正确 的 编码 格式 ， 解 码 显示 。 

对 于 unicode 对 象 进行 编码 , 编码 成 一 个 utf-8 编码 的 st 一 如 s_utf8，s_utf8 就 是 一 个 字 节 数组 , print 
语句 的 实现 是 将 要 输出 的 内 容 传送 给 操作 系统 ， 操 作 系 统 会 根据 系统 的 编码 对 输入 的 字 节 流 进行 编码 ， 
为 编码 用 GB2312 去 解释 ， 其 显示 出 来 就 错误 了 。 
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> 学 习 指引 


我 们 在 别 的 编程 语言 中 学 习 过 数组 ， 数 组 通常 存储 的 是 相同 数据 类 型 的 元 素 ， 并 且 每 个 元 素 都 是 按照 
位 置 编 号 来 顺序 存 取 的 。Python 中 类 似 于 数组 功能 的 数据 类 型 是 序列 ， 也 将 每 个 元 素 按照 位 置 编 号 进行 操 
作 ， 而 序列 中 的 列表 和 元 组 可 以 存储 不 同 的 元 素 。Python 中 的 序列 类 型 使 得 批量 处 理 数据 更 加 方便 灵活 。 

Python 中 的 列表 、 元 组 均 属 于 Python 序列 类 型 。 它 们 在 很 多 操作 上 具有 相同 之 处 。 不 同 的 是 ， 列 表 中 
的 元 素 是 可 变 的 ， 而 元 组 中 的 数 是 不 可 变 的 。 不 同情 况 下 ， 这 两 种 类 型 有 各 自 的 优势 。 本 章 就 一 起 来 学 习 
一 下 Python 中 的 列表 与 元 组 。 


二 重点 导读 


。 认 识 序 列 。 
。 认 识 列 表 。 
。 认 识 元 组 。 
。 熟悉 序 列 与 操作 方法 。 
。 热 悉 列 表 与 操作 方法 。 
。 熟悉 元 组 与 操作 方法 。 


4.1 什么 是 序列 


序列 是 一 组 元 素 的 集合 ，Python 中 的 字符 串 、 列 表 和 元 组 数据 类 型 均 属于 序列 。 序 列 中 的 每 个 元 素 都 
有 唯一 确定 的 位 置 ， 并 且 是 按 位 置 编 号 顺序 存 取 的 ， 类 似 于 Java、C 语言 中 的 数组 。 不 同 的 是 ， 数 组 存放 
的 都 是 相同 类 型 的 元 素 ， 而 序列 中 的 列表 和 元 组 可 以 同时 存放 不 同类 型 的 元 素 。 列 表 和 元 组 非常 相似 ， 不 
同 的 是 ， 列 表 存 放 的 元 素 是 可 以 变动 的 ， 而 元 组 中 的 元 素 是 不 可 变 的 。 


4.2 序列 通用 操作 


我 们 知道 了 序列 中 有 不 同 的 集合 存在 ， 例 如 列表 、 元 组 、 字 符 串 都 是 不 同 的 序列 ， 但 是 对 于 所 有 序列 
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而 言 ， 都 有 通用 的 操作 ， 本 节 先 介绍 一 些 序列 的 通用 操作 ， 之 后 再 单独 介绍 两 个 典型 的 序列 : 列表 和 元 组 


4.2.1 序列 的 索引 和 切片 


前 面 提 到 过 ,序列 中 的 元 素 是 按照 位 置 编 号 顺序 排序 的 ， 可 以 用 图 4-1 来 描述 序列 中 元 素 与 位 置 的 


元 素 1 元 素 2 元 素 3 元 素 n 

位 置 0 1 2 nl 

正 索 引 数 0 1 2 2 pe | 
负 索 引 数 n ntl nt2 0 1 


图 4-1 序列 中 的 元 素 与 位 置 


提取 元 素 索引 时 使 用 的 是 索引 数 ， 查 询 的 一 般 格式 是 : 序列 名 [索引 数 ]。 正 索引 数 是 从 左 往 右 ， 从 0 
开始 ; 负 索 引 数 是 从 右 往 左 ， 从 -1 开始 。 因 此 通过 索引 数 ， 可 以 实现 正 索引 和 负 索 引 。 注 意 索 引 数 不 能 超 
过 序列 总 长 度 〈 元 素 总 个 数 )。 

【 例 4-1】 索 引 。 

ER | 

print (list1[0]) 

print (list1[1]) 

print (list1[-1]) 

print (list1[-2]) 


程序 运行 结果 如 图 4-2 所 示 。 


图 4-2 索引 运行 程序 

切片 就 是 提取 序列 中 某 一 范围 内 的 元 素 ， 提 取 的 元 素 无 论 有 多 少 ， 都 会 重新 组 成 一 个 新 的 序列 。 分 片 的 格 
式 是 : 序列 名 [起 始 索 引 :中 止 索 引 : 步 长 ]。 其 中 , 切片 从 起 始 所 引出 的 元 素 开始 ， 到 中 止 索引 数 的 前 一 个 数 为 止 。 
步 长 是 非 零 的 整数 ， 作 为 索引 的 间隔 ， 当 步 长 为 正 数 时 ， 从 左 到 右 提 取 元 素 ， 当 步 长 为 负数 时 ， 从 右 到 左 提取 
元 素 ， 如 果 没 有 设 定 步 长 的 参数 则 默认 为 1。 若 索引 段 中 不 设 定 起 始 索引 或 中 止 索 引 ， 则 取 全 部 。 

【 例 4-2】 切 片 。 

1ist1=[1,2,3,4,'a', 'b','c','d'] 

print (list1[0:2]) 

print (list1[0:4:2]) 

print (list1[3:]) 

print (ise SL 

print (listl[-1:]) 

print (1ist1[:]) 


程序 运行 结果 如 图 4-3 所 示 。 


图 4-3 切片 运行 程序 
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序列 计算 


可 以 进行 相 加 、 相 乘 的 运算 。 

“+” 可 以 实现 两 个 序列 的 相 加 、 拼 接 ， 相 加 时 的 序列 必须 是 同类 型 的 。 
“*?” 可 以 将 序列 进行 重复 ， 得 到 一 个 新 的 序列 。 

【 例 4-3】 序 列 计算 。 

1istl=[1v2,3v4r arr bc yd'] 

list2=[5, 6,7] 

a=list1l+1list2 

b=list2*2 

print (a) 

print (b) 


程序 运行 结果 如 图 4-4 所 示 。 


图 4-4 序列 计算 运行 程序 


4.2.3 ”序列 相关 操作 的 函数 


Python 中 提供 了 一 些 函 数 方法 帮助 用 户 操作 序列 。 

。 使 用 in0 和 not in0 两 个 函数 可 以 查询 某 元 素 是 否 在 序列 中 ， 返 回 结果 是 True 或 False; 
。 使 用 len0 函 数 可 以 获取 序列 的 总 长 度 ; 

e 使 用 max0 和 min0 函 数 可 以 获得 序列 中 最 大 和 最 小 的 元 素 ; 

。 使 用 sum0 函 数 可 以 计算 元 素 只 为 数值 的 序列 的 和 。 

【 例 4-4】 序 列 函数 。 


list1=[1,2,3,4,5] 


站 


时 


有 


a 

b=6 

print (a in 1ist1) #in() 函数 

print(b in list1) 

print (len (list1)) #1en () 函数 

print (max (1ist1)) #max() 函数 /min() 函数 
print (min (list1)) 

print (sum(list1)) #5um() 函数 


程序 运行 结果 如 图 4-5 所 示 。 


图 4-5 序列 函数 运行 程序 


4.3 列表 


列表 是 元 素 按 顺序 排列 构成 的 有 序 的 集合 ， 其 中 的 每 个 元 素 都 有 各 自 的 位 置 编 号 ， 方便 索引 操作 。 列 
表 非 常 好 的 优势 是 ， 里 面 的 元 素 可 以 是 各 种 类 型 共存 的 ， 可 以 是 数字 、 字 符 串 甚至 还 可 以 是 列表 、 元 组 、 


048 


第 圆 章 “Python 列表 、 元 组 与 字典 


字典 等 。 列 表 中 的 元 素 是 可 以 被 修改 的 。 


4.3.1 直接 创建 列表 
可 以 用 方 括号 直接 创建 元 组 ， 括 号 里 的 元 素 用 喜 号 隔 开 。 当 [ ] 内 不 存在 任何 元 素 时 ， 便 创建 了 一 个 空 


列表 。 
【 例 4-5】 用 方 括号 创建 列表 。 
1ist1=[] 

list2=[1,2,'a', 'b', [3,1,2], (1,2,3)] 
print (list1) 

print (list2) 


程序 运行 结果 如 图 4-6 所 示 。 


[ 
[1 3 GB, 1 1 


图 4-6 创建 列表 运行 程序 


4.3.2 用 list() 函 数 创建 列表 


回 

其 实 ，list0 函 数 实质 是 把 目标 对 象 转 为 列表 的 类 型 。 同 直接 创建 列表 的 方式 很 像 ， 这 里 是 在 list0 函 数 
后 面 用 圆 括号 将 目标 对 象 转 为 列表 类 型 。 可 以 在 list 的 圆 括号 中 放 入 建立 列表 需要 的 元 素 ， 这 些 元 素 放 入 
时 必须 是 一 个 元 组 对 象 或 者 是 一 个 列表 对 象 ， 不 可 以 直接 将 元 素 列 进 listO 函 数 中 的 括号 里 ， 也 可 以 将 某 
变量 放 进去 ，list0 函 数 会 帮助 我 们 自动 将 元 素 转 为 列表 的 形式 。 同 样 ， 如 果 没 有 传 入 任何 元 素 ， 将 创建 
个 空 的 列表 。 

【 例 4-6】 用 list0 函 数 创建 列表 。 

list1l=list((1,2,'a', [5,'a'],('a',1))) 

tuple_1=(1,2,3) 

list2=list (tuple 1) 

list3=1ist() 

a=1,2,3,4 

1ist4=1ist(a) 

list5=1ist ('ABCDEFG') 

Print (list1) 

print (type (list1)) 

print (list2) 

print (type (list2)) 

print (list3) 

print (type (list3)) 

print (list4) 

print (type (list4)) 

print (list5) 

print (type (1ist5)) 


程序 运行 结果 如 图 4-7 所 示 。 


图 4-7 创建 列表 运行 程序 
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多 得 4.3.3 ”列表 元 素 提取 


列表 中 的 元 素 都 是 有 位 置 的 ， 因 此 常用 的 元 素 提取 方法 有 索引 提取 和 列表 切片 操作 提取 。 每 一 次 通过 
位 置 进行 索引 访问 都 能 得 到 列表 中 唯一 对 应 的 元 素 ， 使 用 切片 操作 则 会 得 到 一 段 包 含 对 应 元 素 的 列表 。 

(1) 索引 提取 元 素 : 利用 序列 的 索引 进行 元 素 提取 的 方法 。 通 过 元 素 的 位 置 ， 提 取 元 素 ， 在 列表 对 象 
后 面 使 用 方 括号 包含 索引 数 。 例 如 ，list[0],list[1],list[2],… 注 意 不 能 超过 列表 总 长 度 。 

如 果 想 要 从 列表 尾部 快速 索引 元 素 ， 则 可 以 使 用 负数 ， 例 如 : list[-1],list[-2],list[-3],… 

【 例 4-7】 索 引 提取 元 素 。 

list1l=1list((1,2,'a', [5,'a'], ('a',1))) 

print (list1[0]) 

print (list1[1]) 


print (1ist1[-1]) 
print (list1[-2]) 


程序 运行 结果 如 图 4-8 所 示 。 


图 4-8 索引 提取 元 素 运行 程序 

(2) 切片 提取 元 素 : 使 用 切片 提取 列表 的 某 段 元 素 时 ， 无 须 考虑 超出 索引 范围 的 问题 。 需 要 注意 的 是 ， 
列表 的 切片 是 一 个 元 组 类 型 。 

【 例 4-8】 切 片 提 取 元 素 。 

1ist1l=tuple((1,2,'a', [5,'a'], ('a',1))) 

list2=1ist1[0:2] 

print (list2) 

print (type (1ist2)) 


程序 运行 结果 如 图 4-9 所 示 。 


图 4-9 切片 提取 元 素 运行 程序 
(3) 列表 反 转 : 使 用 切片 时 ，list[::-1] 这 个 操作 可 以 得 到 list 列表 的 反 转 列表 。 
【 例 4-9】 列 表 反 转 。 
list2=tuple((1,2,'a', [5,'a'], ('a',1))) 
list2=1ist1[::-1] 
print (list2) 
print (type (list2)) 


程序 运行 结果 如 图 4-10 所 示 。 


图 4-10 ”列表 反 转 运行 程序 


4.3.4 ”操作 列表 的 常用 函数 


列表 在 Python 中 是 可 变 的 数据 结构 , 因此 Python 提供 很 多 方便 的 函数 帮助 用 户 对 列表 的 元 素 进行 操作 ， 
常见 的 操作 有 元 素 的 增删 改 查 等 。 
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1. 增添 元 素 

append0 函 数 将 在 列表 尾部 传 入 一 个 元 素 : listappend(])。 

extend() 函 数 可 以 将 列表 1 和 列表 2 拼接 在 一 起 : listl.extend(list2)。 

insert0 函 数 可 以 在 列表 中 的 指定 位 置 插入 一 个 元 素 : listinsert (位 置 ， 元 素 )。 
注意 : 使 用 append0 和 insert0 时 , 一 次 只 能 添加 一 个 元 素 ; 使 用 extend0 时 是 将 列表 拼接 在 另 一 个 列表 尾部 。 
【 例 4-10】 添 加 元 素 。 

1ist1=[1,2,3] 

list2=[6,7,8] 

listl.append (4) # 使 用 append 向 1istl 添加 元 素 

Print (list1) 

listl.extend(1ist2) ”# 使 用 extend 拼接 1istl 和 1ist2 

Print (list1) 

listl.insert (4,5) # 使 用 insert 向 1ist1 添加 元 素 

print (list1) 


程序 运行 结果 如 图 4-11 所 示 。 


图 4-11 添加 元 素 运行 程序 


2. 删除 元 素 

del0 函 数 将 列表 中 提取 出 的 元 素 删除 〈 用 索引 提取 ): del list[0]。 

pop0O 函 数 根据 索引 获取 该 元 素 并 删除 ，listpop(0)。 

remove() 函 数 将 指定 元 素 删 除 :list.remove(1)。 

注意 : 使 用 popO 函 数 时 ， 若 不 指定 元 素 位 置 ， 将 默认 使 用 索引 -1; remove0 删 除 指定 元 素 时 ， 只 会 将 
第 一 次 出 现 的 该 元 素 删除 。 

【 例 4-11】 删 除 元 素 。 


list1=[1,2,3,'a','b',"'c'] 


del 1ist1[0] # 使 用 del 
print (list1) 
list1.pop(0) # 使 用 Pop 


print (list1) 
1list1.remove(3) ”# 使 用 remove 
print (list1) 


程序 运行 结果 如 图 4-12 所 示 。 


图 4-12 ”删除 元 素 运 行程 序 

3. 修改 元 素 

根据 列表 元 素 可 变 的 特性 ， 可 以 直接 提取 元 素 并 进行 重新 赋值 ， 从 而 完成 修改 元 素 的 操作 。 提 取 元 素 
根据 元 素 地 址 索引 进行 。 

4. copy 方 法 

有 了 时 需要 在 保存 原来 的 列表 数据 的 同时 对 这 个 列表 进行 变更 操作 ,此 时 会 用 到 copy 方法 。copy 方法 能 
够 创建 一 个 完全 一 样 的 列表 ， 虽 然 意思 上 是 一 样 的 列表 ， 但 只 是 元 素 一 样 ，copy 后 的 一 个 列表 已 经 是 一 个 
新 的 列表 。 
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【 例 4-12】copy 方法 。 
ET TR | 
1ist2=1ist1.copy() 

print (1ist2) 


程序 运行 结果 如 图 4-13 所 示 。 


l 图 4-13 copy 方法 运行 程序 
5. index 查询 

index 能 够 帮助 我 们 快速 查找 某 元 素 在 该 列表 中 的 位 置 。 

【 例 4-13】index 查询 。 


list1l=[1,2,3,'a','b','c'] 
print (listl.index('a')) 


程序 运行 结果 如 图 4-14 所 示 。 


图 4-14 index 查询 运行 程序 


4.4 元 组 


还 有 一 种 序列 是 元 组 ， 它 与 列表 十 分 类 似 ， 不 同 之 处 在 于 ， 列 表 中 的 元 素 可 以 被 修改 ， 而 元 组 中 的 元 
素 不 能 修改 ， 在 写法 上 ， 列 表 使 用 方 括号 定义 ， 而 元 组 使 用 圆 括号 定义 。 


4.4.1 直接 创建 元 组 


最 基本 的 方法 是 用 圆 括号 创建 元 组 ， 括 号 里 的 元 素 用 逗号 隔 开 。 喜 号 必须 存在 ， 当 元 组 中 仅 有 一 个 元 
素 时 ， 在 其 后 面 必须 加 上 逗号 来 消除 歧义 。Python 中 ， 用 来 定义 元 组 的 关键 信息 是 逗号 ， 有 时 圆 括号 都 可 
以 省 略 。 使 用 圆 括 号 时 ， 若 不 向 圆 括号 中 输入 任何 元 素 ， 则 会 创建 一 个 空 元 组 。 

【 例 4-14】 用 圆 括号 创建 元 组 。 


tuple 1 =('hi',1, (2,3), [6,7]) 
tuple 2 =() 

tuple 3 =1,2,3 

print (tuple 1) 

print (type (tuple_1)) 

print (tuple 2) 

print (type (tuple 2)) 

print (tuple_3) 

print (type (tuple_3)) 


程序 运行 结果 如 图 4-15 所 示 。 


图 4-15 创建 元 组 运行 程序 
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4.4.2 ”用 tuple() 函 数 创建 元 组 


使 用 tupleO) 函 数 能 够 将 其 他 数据 结构 对 象 转换 成 元 组 的 类 型 。 常 见 的 是 将 一 个 列表 转换 成 元 组 ， 需 要 吕 
先 创建 一 个 列表 并 把 元 素 存 入 其 中 。tuple0 在 使 用 时 需要 在 列表 最 外 层 加 入 圆 括号 来 说 明 转 换 对 象 。 

【 例 4-15】 用 tuple0 函 数 创建 元 组 。 

tuple 1 =tuple(['hi',1, (2,3),[6,7]]) 

tuple 2 =tuple() 

tuple 3 =tuple((1,2,3)) 

print (tuple_ 1) 

print (type (tuple 1)) 


程序 运行 结果 如 图 4-16 所 示 。 


4-16 创建 元 组 运行 程序 


4.4.3 ”元 组 元 素 提取 


回 3 
元 组 是 不 可 变 的 元 素 ， 虽 然 不 能 和 列表 一 样 对 里 面 的 元 素 进行 增删 改 ， 但 仍然 可 以 对 元 组 内 的 元 素 进 
行 索 引 、 访 问 、 提 取 和 切片 的 操作 。 其 中 ， 对 于 元 组 元 素 的 提取 ， 可 以 使 用 元 组 解 包 简 化 赋值 操作 。 
(1) 索引 提取 元 素 : 利用 序列 的 索引 进行 元 素 提取 。 通 过 元 素 的 位 置 提取 元 素 ， 需 要 注意 元 组 的 长 度 ， 
不 能 超出 索引 范围 。 
【 例 4-16】 索 引 访问 元 素 。 
tuple_1=(2,1,3,5,4) 


print (tuple 1[0]) 
print (tuple 1[1]) 


程序 运行 结果 如 图 4-17 所 示 。 


图 4-17 索引 提取 元 素 运 行程 序 
(2) 切片 提取 元 素 : 获取 元 组 的 切片 ， 无 须 考虑 超出 索引 范围 的 问题 。 需 要 注意 的 是 ， 元 组 的 切片 也 
一 个 元 组 。 
【 例 4-17】 切 片 访问 元 素 。 
tuple 1=(2,1,3,5,4) 


print (tuple_1[1:2]) 
print(tuple 1[1:7]) 


程序 运行 结果 如 图 4-18 所 示 。 


并 


图 4-18 切片 提取 元 素 运行 程序 
(3) 元 组 解 包 利用 Python 语言 的 灵活 性 ， 将 元 组 中 的 元 素 赋值 给 多 个 变量 。 
【 例 4-18】 元 组 解 包 。 


tuple 1=(2,1,3,5,4) 
asb,c,d,e=tuple 1 
print (a,b,c,d,e) 
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程序 运行 结果 如 图 4-19 所 示 。 


4-19 元 组 解 包 运行 程序 


34.4.4 元 组 常用 操作 方法 


由 于 元 组 无 法 修改 元 素 ， 相 对 于 列表 操作 的 范围 就 比较 小 ， 常 见 的 仍然 是 对 元 组 进行 元 素 位 置 查询 等 
操作 。 下 面 列 出 了 一 些 常用 于 操作 元 组 的 方法 。 


+: 将 两 个 元 组 合并 为 一 个 元 组 。 

*， 重 复合 并 同一 个 元 组 为 一 个 更 长 的 元 组 。 

len: 获取 元 组 长 度 。 

sorted: 创建 对 元 素 进行 排序 后 的 列表 。 

tuple.count: 记录 某 个 元 素 在 元 组 中 出 现 的 次 数 。 
tuple.index: 获取 元 素 在 元 组 当中 第 一 次 出 现 的 位 置 的 索引 。 
【 例 4-19】 元 组 的 基本 操作 。 

tuple 1=(2,1,3,5,4) 

tuple 2=("'a’r by "cry"d") 

print('tuple 1=',tuple 1) 

print('tuple 2=',tuple 2) 

tuple_3=tuple_ 1l+tuple 2 # 用 '+' 合 并 元 组 

print (' 用 "+" 合 并 元 组 : ') 

print (tuple_3) 

tuple_4=tuple_1*2 # 用 '*' 重 复元 组 
print (' 用 "*" 合 并 元 组 :') 

print (tuple_ 4) 

length=len (tuple_1) 4 获取 元 组 长 度 
print (' 获 取 元 组 长 度 :') 

print (length) 

list1=sorted (tuple_1) # 用 sorted 对 元 组 元 素 进行 排序 , 自动 生成 新 列表 
print (' 用 sorted 对 元 组 元 素 进行 排序 , 自动 生成 新 列表 ' ) 

print (list1) 

sum=tuple_4.count (1) # 用 count 函数 进行 元 素 计数 
print (' 用 count 和 函数 进行 元 素 "1" 计 数 :') 

print (sum) 


adr=tuple_1.index (3) # 用 index 函数 获取 元 素 位 置 
print (' 用 index 函数 获取 元 素 "3" 的 位 置 :') 
print (adr) 


程序 运行 结果 如 图 4-20 所 示 。 


”图 4-20 元 组 基本 操作 运行 程序 
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4.5 ”字典 的 使 用 


Python 中 的 字典 是 一 个 无 序 的 数据 值 集合 ， 用 于 存储 数据 值 ， 如 地 图 。 与 其 他 只 保存 单个 值 的 数据 类 
型 不 同 ， 字 典 保存 键 值 对 。 字 典 中 提供 了 键 值 以 使 其 更 加 优化 。 字 典 中 的 每 个 键 值 对 用 冒号 “: ”分 隔 ， 而 
每 个 键 用 “逗号 ”分 隔 。 

Python 中 的 词典 与 现实 世界 中 的 词典 类 似 。Dictionary 的 键 必须 是 唯一 的 ， 并 且 是 不 可 变 的 数据 类 型 ， 
如 字符 串 、 整 数 和 元 组 ， 但 键 值 可 以 重复 并 且 可 以 是 任何 类 型 。 

注意 一 下 ， 字 典 中 的 键 不 允许 多 态 性 。 在 Python 中 ， 可 以 通过 将 元 素 序 列 放 在 cur 了 括号 内 来 创建 一 
个 Dictionary， 用 “逗号 ”分 隔 。Dictionary 包含 一 对 值 ， 一 个 是 Key， 另 一 个 对 应 的 元 素 是 Value。 字 典 中 
的 值 可 以 是 任何 数据 类 型 ， 可 以 赋值 ， 而 键 不 能 重复 ， 必 须 是 不 可 变 的 。 

字典 也 可 以 通过 内 置 函数 dict0 创 建 ， 只 需 放置 大 括号 个 就 可 以 创建 一 个 空 字典 。 

注意 一 下 ， 字 典 键 区 分 大 小 写 ， 名 称 相同 但 Key 的 不 同情 况 将 被 明确 区 分 。 


4.5.1 获取 字典 中 的 值 


由 于 字典 是 一 种 键 值 对 的 结构 ， 所 以 可 以 通过 将 键 作为 索引 去 访问 对 应 的 值 。 代 码 如 下 : 
【 例 4-20】 获 取 字典 中 的 值 。 

dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'} 

print ("dict['Name']: ", dict['Name']) 

Print ("dict['Age']: ", dict['age']) 

程序 运行 结果 如 图 4-21 所 示 。 


图 4-21 获取 字典 中 的 值 
记 住 ， 使 用 的 索引 值 必须 是 字典 中 有 的 ， 如 果 没 有 则 会 产生 错误 。 代 码 如 下 : 
【 例 4-21】 如 果 字典 中 没有 该 索引 值 ， 则 产生 错误 。 


dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}; 
print ("dict['Alice']: ", dict['Alice']) 


如 果 这 样 使 用 将 会 产生 如 图 4-22 所 示 的 错误 。 


4-22 ”错误 的 结果 


4.5.2 更 新 字典 中 的 值 


加 
可 以 通过 添加 新 条 目 或 键 值 对 来 更 新 字典 , 修改 现 有 条 目 或 删除 现 有 条 目 , 如 下 面 给 出 的 简单 实例 
所 示 。 
【 例 4-22】 更 新 字典 中 的 值 。 


dict = {'Name': 'Zara', ‘Age': 7, 'Class': 'First’'} 
dict['Age'] = 8; # 更 新 age 的 值 
dict['school'] = "DPS School" # 增加 新 的 键 值 对 
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print ("dict['Age']: "，dict['age']) 
print ("dict['schoo1']: ", dict['school1']) 


程序 运行 结果 如 图 4-23 所 示 。 


4-23 ”运行 结果 


4 5.3 ”删除 字典 中 的 什 


我 们 可 以 删除 单个 词典 元 素 或 清除 词典 的 全 部 内 容 ， 也 可 以 在 一 次 操作 中 删除 整个 字典 。 
要 显 式 删 除 整个 字典 ， 只 需 使 用 del 语句 。 
【 例 4-23】 删 除 字典 中 的 值 。 


dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'} 
del dict['Name'] # 移 除 Name 这 个 键 值 对 
dict.clear() # 移 除 所 有 的 键 值 对 

del dict + 删除 整个 字典 

print ("dict['Age']: ", dict['age']) 

print ("dict['school']: ", dict['school1']) 


注意 如 果 删 除 之 后 发 生 错误 ， 那 么 字典 将 不 存在 。 运 行 上 述 代码 ， 产 生 如 图 4-24 所 示 错 误 。 


图 4-24 ”错误 运行 结果 


4.6 字典 中 的 方法 
Python 中 内 置 了 很 多 对 字典 操作 的 方法 ， 下 面 一 起 来 看 一 下 。 
遍历 字典 
【 例 4-24】 遍 历 字典 。 
Ja by 
for k in b.keys(): # 访 历 b 这 个 字典 的 所 有 键 
print ("Got key"，k，"which maps to value", b[k]) 


ks = list(b.keys()) 
print (ks) 


通过 上 述 代 码 ， 遍 历 了 b 字典 的 所 有 键 ， 同 时 能 根据 键 获取 对 应 的 值 。 


程序 运行 结果 如 图 4-25 所 示 。 


图 4-25 运行 结果 
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【 例 4-25] 和 迭代 字典 中 的 键 是 很 常见 的 , 可 以 省 略 for 循环 中 的 键 方法 调用 迭代 遍历 字典 隐 式 迭代 其 键 。 
代码 如 下 。 
TOr KE jn bs 
print ("Got key", k) 
下 面 展示 几 个 直接 获取 所 有 值 或 者 键 的 方法 。 
【 例 4-26】 将 b 字典 的 所 有 值得 出 转换 为 list 打印 。 
>>> list(b.values()) 
['tres', "dos'， "uno'] 
【 例 4-27】 将 b 字典 的 所 有 的 键 值 对 得 出 转换 为 list 打印 。 
>>> list(b.items()) 
Dthreey "tres yy ("two GOALOOneT On 
【 例 4-28】 以 键 值 对 的 方式 获取 b 字典 的 键 值 对 。 
for (k,v) in b.items(): 
print ("Got", Kk,"that maps to",v) 


程序 运行 结果 如 图 4-26 所 示 。 


图 4-26 运行 结果 


4.6.2 别名 与 复制 
回 ， 
与 列表 的 情况 一 样 ， 因 为 字典 是 可 变 的 ， 我 们 需要 知道 别名 。 每 当 两 个 变量 引用 同一 个 对 象 时 ， 对 一 
个 变量 的 更 改 会 影响 另 一 个 。 
【 例 4-29】 如 果 想 要 修改 字典 并 保留 原始 副本 ， 请 使 用 复制 方法 。 例 如 ，opposites 是 一 个 包含 反义词 


的 字 


opposites = {"up": "down", "right": "wrong", "yes": "no"} 

alias = opposites 

copy = opposites.copy() # 浅 拷贝 

【 例 4-30】alias 和 opposites 是 指 同一 个 对 象 ，copy 是 指 同一 字典 的 新 副本 。 如 果 修改 alias，opposites 
alias["right"] = "left" 

opposites ["right"] 

程序 运行 结果 如 图 4-27 所 示 。 


EE 
图 4-27 运行 结果 


如 果 是 复制 ， 那 么 opposites 是 不 会 改变 的 。 


4.6.3 ”统计 频率 


Python 的 字典 的 api 能 够 帮助 统计 字符 串 中 字母 的 频率 ， 下 面 看 一 下 它 的 使 用 方法 。 
【 例 4-31】 统 计 频率 1。 
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letter counts = {} 
for letter in "Mississippi": 

letter counts[letter] = letter counts.get(letter, 0) +1 
print (letter_ counts) 


程序 运行 结果 如 图 4-28 所 示 。 


图 4-28 运行 结果 


我 们 从 一 个 空 字典 开始 。 对 于 字符 串 中 的 每 个 字母 ， 找 到 当前 计数 〈 可 能 为 零 ) 并 递增 它 。 最 后 ， 字 


典 包含 字母 对 和 它们 的 频率 。 


按 字母 顺序 显示 频率 表 可 能 更 有 吸引 力 ， 可 以 使 用 items 和 sort 方法 来 做 到 这 一 点 。 


【 例 4-32】 统 计 频 率 2。 

letter items = list(letter counts.items()) 
letter items.sort() 

print (letter items) 


程序 运行 结果 如 图 4-29 所 示 。 


图 4-29 运行 结果 


4.6.4 字典 排序 


对 字典 进行 排序 ? 这 其 实 是 一 个 伪 命题 ， 首 先 搞 清 楚 Python 字典 的 定义 , 字 


本 身 默认 以 Key 的 字符 


顺序 输出 显示 ， 就 像 人 们 用 的 真实 的 字典 一 样 ， 按 照 ABCD 字母 的 顺序 排列 ， 并 且 本 质 上 各 自 没 有 先后 关 


系 ， 是 一 个 哈 希 表 的 结构 。 


但 实际 应 用 中 确实 有 这 种 排序 的 “需求 ” 即 按照 Values 的 值 “ 排 序 ” 输 出 ， 或 者 按照 别 的 奇怪 的 顺 


序 进行 输出 ， 只 需要 把 字典 转换 成 list 或 者 tuple， 把 字典 每 一 对 键 值 转换 为 list 
输出 ， 就 可 以 达到 目的 。 

【 例 4-33】 字 典 排序 1。 

do 

import operator 

sorted x=sorted (x.items () ,key=operator.itemgetter(0)) 

+ 按照 item 中 的 第 一 个 字符 进行 排序 , 即 按照 Key 排序 

print (x) 

print (sorted x) 


print (dict (sorted x)) 
程序 运行 结果 如 图 4-30 所 示 。 


4-30 ”运行 结果 


h 的 子 list 或 者 子 tuple 再 


字典 始终 都 按照 Key 从 小 到 大 排序 , 与 定义 过 程 无 关 , 转换 为 list 说 套 tuple 这 里 也 依然 按照 Key 排序 。 


【 例 4-34】 字 典 排序 2。 
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x={2:1,3:4,4:2,1:5,5:3} 

import operator 

sorted x=sorted (x.items(),key=operator.itemgetter (1)) 
# 这 里 改 为 按照 item 的 第 二 个 字符 排序 , 即 Value 排序 

print (x) 

print (sorted x) 

print (dict (sorted x)) 


程序 运行 结果 如 图 4-31 所 示 。 


图 4-31 运行 结果 
字典 的 顺序 依旧 不 变 ， 但 转换 为 list 嵌 套 tuple 格式 之 后 ， 完 成 了 按照 Value 排序 的 操作 。 


4.7 ”字典 练习 与 实战 


刚 学 完了 字典 的 基本 使 用 ， 下 面 来 练习 一 下 它 的 使 用 吧 ! 
【 例 4-35】 简 单 的 通讯 录 程 序 系统 。 


print ('''|--- 欢 迎 进入 通讯 录 程 序 ---| 
1---1、 查询 联系 人 资料 ---| 
1---2、 插入 新 的 联系 人 ---| 
1---3、 删除 已 有 联系 人 ---1 
1---4、 退出 通讯 录 程 序 ---|1" 77) 
addressBook={}# 定 义 通讯 录 
while 1: 
temp=input (' 请 输入 指令 代码 : ') 
if not temp.isdigit () : 
print ("输入 的 指令 错误 , 请 按照 提示 输入 ") 
continue 
item=int (temp) 4 转换 为 数字 
if item==4: 
Print ("1--- 感 谢 使 用 通讯 录 程 序 ---1") 
break 
name = input ("请 输入 联系 人 姓名 :") 
Fi 
if name in addressBook: 
Print (name, ':',addressBook [name]) 
continue 
else: 
print ("该 联系 人 不 存在 ! ") 
teme=2: 
if name in addressBook: 
print ("您 输入 的 姓名 在 通讯 录 中 已 存在 -->>", name, ":",addressBook [name]) 
isEdit=input ("是 否 修改 联系 人 资料 (Y/N) :") 
if isEdit=="Y": 
userphone = input ("请 输入 联系 人 电话 : ") 
addressBook [name]=userphone 
print ("联系 人 修改 成 功 ") 


continue 
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else: 
continue 

else: 
userphone=input ("请 输入 联系 人 电话 : ") 
addressBook [name]=userphone 
print ("联系 人 加 入 成 功 ! ") 
continue 

if item==3; 

if name in addressBook: 
del addressBook [name] 
print ("删除 成 功 ! ") 
continue 

else: 


print ("联系 人 不 存在 ") 


4.8 就 业 面试 技巧 与 解析 


通过 本 章 的 学 习 ， 读 者 知道 了 什么 是 序列 ， 序 列 的 一 些 计算 和 相关 操作 的 函数 ， 在 列表 中 创建 列表 的 
方法 ， 操 作 列表 的 常用 函数 ;在 元 组 中 创建 元 组 的 方法 以 及 元 组 元 素 的 提取 ， 在 字典 中 获取 、 更 新 、 删 除 
字典 中 的 值 和 字典 中 的 常用 方法 。 要 学 会 灵活 运用 这 些 知识 ， 才 能 在 面试 中 脱颖而出 。 


4.8.1 面试 技巧 与 解析 (一 ) 


面试 官 : 字典 如 何 删除 键 和 合并 两 个 字典 ? 
应 聘 者 : del 和 update 方法 。 


4.8.2 面试 技巧 与 解析 《二 ) 


面试 官 : 负 索 引 是 什么 ? 如 何 快速 实现 tuple 和 list 的 转换 ? 

应 聘 者 : Python 中 的 序列 索引 可 以 是 正 也 可 以 是 负 。 如 果 是 正 索 引 , 0 是 序列 中 的 第 一 个 索引 ，1 是 第 
二 个 索引 。 如 果 是 负 索 引 ，-1 是 最 后 一 个 索引 而 -2 是 倒数 第 二 个 索引 。tuple 和 list 的 转换 是 以 list 作为 参 
数 将 tuple 类 初始 化 ， 将 返回 tuple 类 型 ， 以 tuple 作为 参数 将 list 类 初始 化 ， 将 返回 list 类 型 。 
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在 了 解 了 Python 的 基本 概念 、 基 本 应 用 之 后 ， 本 篇 将 详细 介绍 Python 的 核心 技术 ,包括 使 用 字符 
串 及 运算 符 、 程 序 的 控制 结构 、 函 数 、 文 件 与 文件 目录 、 数 据 格式 化 、Python 类 、 模 块 等 。 通 过 本 篇 
的 学 习 ， 读 者 对 Python 的 核心 技术 会 有 更 深刻 的 理解 和 应 用 。 


第 5 章 使 用 Python 字符 串 及 运算 符 
第 6 章 控制 流程 和 控制 语句 
第 7 章 函数 

第 8 章 文件 与 文件 目录 

第 9 章 数据 格式 化 

第 10 章 Python 类 的 使 用 

第 11 章 ”Python 模块 的 使 用 


第 5 章 
使 用 Python 字符 串 及 运算 符 


7 学 习 指引 


字符 串 就 是 一 系列 字符 。 在 Python 中 ， 用 引号 括 起 来 的 都 是 字符 串 ， 其 中 的 引号 可 以 是 单 引 号 ， 也 可 
以 是 双 引 号 。 字 符 串 虽然 看 似 简单 ， 但 是 能 够 以 很 多 不 同 的 方式 去 使 用 它们 。 在 Python 中 有 许多 的 运算 符 ， 
通过 这 些 运算 符 ， 可 以 对 数据 进行 不 同 的 操作 。 


二 ”重点 导读 


“Python 字符 串 基 本 操作 。 
。Python 格式 化 字符 串 。 

。 算 术 运 算 符 。 

*。 赋 值 运算 符 。 

。 比 较 运算 符 。 

*， 逻辑 运 算 符 。 

* 成 员 运 算 符 。 

* 身份 运算 符 。 


5.1 字符 串 基本 操作 


Python 字符 串 的 常用 操作 ， 包 括 字符 串 的 替换 、 截 取 、 复 制 、 连 接 、 比 较 、 查 找 等 。 
在 Python 中 ， 字 符 串 有 时 候 会 有 许多 的 空格 ， 如 果 想 去 除 空格 ， 就 需要 以 下 一 些 方法 。 
【 例 5-1】 分 别 去 除 字符 串 两 边 的 空格 、 字 符 串 左边 的 空格 和 字符 串 右 边 的 空格 。 

(1) strip0: 删除 字符 串 两 边 的 指定 字符 ， 默 认为 空 

a=* hello 


b=a.strip() 
print (b) 


(2) lstrip0: 删除 字符 串 左 边 的 指定 字符 ， 默 认为 空格 。 


a=" hello 中 
b=a.1strip() 
print (b) 
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(3) rstrip0: 删除 字符 串 右边 指定 字符 ， 默 认为 空格 。 


= hello S 

b=a.rstrip() 

Print (b) 

程序 运行 结果 如 图 

【 例 5-2】 复制 字符 串 。 

a='hello world' 
b=a 

print (a,b) 


程序 运 


a="'hello " 
b="'world' 
print (a+b) 


程序 运行 结果 如 图 


5-1 所 示 。 


运行 结果 如 图 5-2 所 示 。 
【 例 5-3】 连 接 字符 串 +: 


连接 两 个 字符 串 。 


5-3 所 示 。 


【 例 5-4】 使 用 len0 求 给 定 的 字符 串 长 度 。 


a='hello world' 
print (len(a)) 


程序 运行 结果 如 图 


[| rm 


图 5-1 去 除 空格 结果 


图 5-2 ”复制 字符 串 结果 图 5-3 连接 字符 串 结果 图 54 求 字符 串 长 度 结果 


【 例 5-5】 字 符 串 中 字母 大 小 写 转换 。 


使 用 lower0 将 字符 串 中 的 字 臣 
大 小 写 互 换 ，capitalize0 将 字符 串 中 的 首 字母 大 写 。 


中 的 字 玉 
a='Hello World' 
print (a.lower ()) 
a='Hello World' 
print (a.upper ()) 
a='Hello World'" 
print (a.swapcase()) 
a='Hello World' 
print (a.capitalize()) 


程序 运行 结果 如 图 
【 例 5-6】 使 月 


a='hello world' 


cent 


转换 为 小 写 , upper0 将 字符 串 中 的 字母 转换 为 大 写 ，swapcase0 将 字符 串 


#1ower () 转换 为 小 写 
#upper () 转换 为 大 写 
#5wapcase() 大 小 写 互 换 


#capitalize() 首 字 母 大 写 


5-5 所 示 。 
ter() 方 法 将 字符 串 放 入 中 心 位 置 ， 可 指定 长 度 以 及 位 置 两 边 字符 。 


print (a.center (20,'*')) 


程序 运行 结果 如 图 5-6 所 示 。 
【 例 5-7】 使 用 countO 进 行 字符 串 统计 ， 在 给 定 的 字符 串 中 统计 特定 字符 的 个 数 。 下 面 是 统计 字符 串 a 
中 字符 了 的 个 数 。 


a='hello World'" 
print (a.count ('1')) 
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程序 运行 结果 如 图 5-7 所 示 。 

【 例 5-8】 通 过 [ : ] 进 行 字符 串 切 片 。 
str="0123456789" 
print (str[0:3]) 


#4 截取 第 一 位 到 第 三 位 的 字符 


print (str[:]) # 截 取 字 符 串 的 全 部 字符 

print (str[6:]) # 截 取 第 七 个 字符 到 结尾 

print (str[:-3] ) # 截 取 从 头 开始 到 倒数 第 三 个 字符 之 间 
print (str[2]) + 截取 第 三 个 字符 


+ 截取 倒数 第 一 个 字符 
地 创造 一 个 与 原 字符 囊 顺 序 相反 的 字符 囊 


print(str[-1] ) 
print (str[::-1]) 
Print (str[-3:-1] ) 
print (str[-3:]) 
Print (str[:-5:-3]) 


程序 运行 结果 如 图 5-8 所 示 。 


# 截 取 倒数 第 三 位 到 结尾 


-6 字符 串 放 入 中 心 
位 置 结果 


图 5 


5-5 ”字符 串 字母 
大 小 写 转 换 结果 


图 5-7 


# 逆 序 截取 ,截取 倒数 第 五 位 数 与 倒数 第 三 


# 截 取 倒 数 第 三 位 与 倒数 第 一 位 之 间 的 字符 


位 数 之 间 


图 5-8 切片 操作 结果 


统计 字符 串 结果 


5.2 格式 化 字符 串 


在 编写 程序 的 过 程 中 ， 经 常 需要 进行 格式 化 的 输出 ，Python 中 提供 了 字符 串 格式 化 操作 符 %， 非 常 类 
似 C 语言 中 的 printf0 函 数 的 字符 串 的 格式 化 (C 语言 中 也 使 用 %)。 格 式 化 字符 串 时 ，Python 使 用 一 个 字符 


串 作为 一 个 模板 ， 模 板 中 有 格式 符 ， 这 些 格式 符 为 真实 数值 预 


Python 中 常见 的 字符 串 格式 化 符号 可 以 包含 的 类 型 见 表 5- 


留 位 置 ， 并 说 明 真实 数值 应 该 呈现 的 格式 。 
1。 


表 5-1 格式 符 类 型 
格 式 符 说 明 
%e 格式 化 字符 及 其 ASCII 码 
%s 格式 化 字符 串 
%d 格式 化 整数 
%u 格式 化 无 符号 整数 
%o 格式 化 无 符号 八进制 数 
hx 格式 化 无 符号 十 六 进 制 数 
%X 格式 化 无 符号 十 六 进 制 数 (大 写 ) 
%f 格式 化 浮 点 数 ， 可 指定 小 数 点 后 的 精度 
%e 用 科学 记 数 法 格式 化 浮 点 数 
%g %e 和 %fo%6E 和 %F 的 简写 


输出 % 
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通过 “%” 可 以 进行 字符 串 的 格式 化 ， 但 是 “%” 经 常会 结合 下 面 的 操作 辅助 指令 一 起 使 用 ， 如 表 5-2 


所 示 。 
表 5-2 操作 辅助 符 
辅助 符号 说 明 
* 定义 宽度 或 者 小 数 点 精度 
- 用 作 左 对 齐 
4 | 在 正 数 前 面 显 示 加 号 (+) 
0 显示 的 数字 前 面 填充 '0' 而 不 是 默认 的 空格 
% %% 输 出 一 个 单一 的 '%' 
(aD) | 映射 变量 (字典 参数 ) 


m 是 显示 的 最 小 总 宽度 ，n 是 小 数 点 后 的 位 数 


5.2.1 格式 化 字符 串 符号 的 简单 使 用 


下 面 一 起 通过 对 三 个 格式 化 字符 串 符号 %s,%d,%f 的 简单 使 用 ， 来 看 看 格式 化 字符 串 符号 的 用 法 。 
【 例 5-9】%s 字符 串 的 简单 使 用 。 


string="hello™" 


#%s 打印 时 结果 是 hello 

print ("string=%s" % string ) # output: string=hello 

#4%2s 意思 是 字符 囊 长 度 为 2, 当 原 字符 串 的 长 度 超过 2 时 , 按 原 长 度 打 印 , 所 以 $2s 的 打印 结果 还 是 hello 
print ("string=%2s" % string ) # output: string=hello 


#4%7s 意思 是 字符 囊 长 度 为 7, 当 原 字符 串 的 长 度 小 于 7 时 ,在 原 字符 囊 左 侧 补 空格 ， 
# 所 以 87s 的 打印 结果 是 hello 

print ("string=%7s" % string ) # output: string= hello 
4#5%-7s 意思 是 字符 囊 长 度 为 7， 当 原 字符 串 的 长 度 小 于 7 时 ,在 原 字符 串 右 侧 补 空格 ， 
# 所 以 %-7s 的 打印 结果 是 hello 


print ("string=%-7s!" % string) # output: string=hello ! 
#$.25 意思 是 截取 字符 串 的 前 两 个 字符 ,所 以 5%.2s 的 打印 结果 是 he 
print ("string=%.2s" % string) # output: string=he 


程序 运行 结果 如 图 5-9 所 示 。 


图 5-9 ”%s 使 用 结果 


【 例 5-10】%d 整数 的 简单 使 用 。 


num=14 

#%d 打印 时 结果 是 14 

print ("num=%d" $$ num ) # output: num=14 

#$1d 意思 是 打印 结果 为 1 位 整数 ， 当 整数 的 位 数 超过 1 位 时 , 按 整 数 原 值 打印 ,所 以 sld 的 打印 结果 还 是 14 
Print("num=%ld" $% num ) # output: num=14 

#%3d 意思 是 打印 结果 为 3 位 整数 ， 当 整数 的 位 数 不 够 3 位 时 ,在 整数 左 侧 补 空格 ,所 以 s3d 的 打印 结果 是 14 
print ("num=%3d" $% num ) # output: num= 14 

#$-3d 意思 是 打印 结果 为 3 位 幕 数 ， 当 闽 数 的 位 数 不 够 3 位 时 ,在 整数 右 侧 补 空格 ,所 以 s3d 的 打印 结果 是 14_ 
print ("num=%-3d" s num ) # output: num=14_ 
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#$05d 意思 是 打印 结果 为 5 位 幕 数 ， 当 闽 数 的 位 数 不 够 5 位 时 ,在 整数 左 侧 补 0, 所 以 s05d 的 打印 结果 是 00014 
print ("num=%05d" $% num) # output: num=00014 


#S.3d 小 数 点 后 面 的 3 意思 是 打印 结果 为 3 位 整数 ， 

## 当 整数 的 位 数 不 够 3 位 时 ,在 整数 左 侧 补 0, 所 以 s.3d 的 打印 结果 是 014 
print ("num=$%.3d" $% num ) # output: num=014 

程序 运行 结果 如 图 5-10 所 示 。 

【 例 5-11】%f 浮 点 数 的 简单 使 用 。 

import math 

#$%a.bf,a 表示 浮 点 数 的 打印 长 度 ,b 表示 浮 点 数 小 数 点 后 面 的 精度 

# 只 是 $f 时 表示 原 值 , 默认 是 小 数 点 后 5 位 数 


print ("PI=%f" % math.pi) # output: PI=3.141593 
#4 只 是 %9f 时 ,表示 打印 长 度 为 9 位 数 ， 小 数 点 也 占 一 位 , 不够 左 侧 补 空格 
print ("PI=%9f" % math.pi) # output: PI= 3.141593 


+#+ 只 有 .没有 后 面 的 数字 时 ,表示 去 掉 小 数 输出 整数 , 03 表示 不 够 3 位 数 左 侧 补 0 
print ("PI=%03.f" % math.pi ) # output: PI=003 

#%6.3f 表示 小 数 点 后 面 精确 到 3 位 ,总 长 度 6 位 数 , 包 括 小 数 点 ,不 够 左 侧 补 空格 
print ("PI=%6.3f" % math.pi) # output: PI= 3.142 

#4%-6.3f 表示 小 数 点 后 面 精确 到 3 位 ,总 长 度 6 位 数 ,包括 小 数 点 ,不 够 右 侧 补 空格 
print ("PI=%-6.3f" % math.pi) # output: PI=3.142_ 


程序 运行 结果 如 图 5-11 所 示 。 


图 5-10”%d 使 用 结果 5-11 ”%f 使 用 结果 


5.2.2 ”字符 宽度 和 精度 


字符 宽度 : 转换 后 的 值 所 保留 的 最 小 字符 个 数 。 

精度 ， 对 于 数字 转换 来 说 ， 结 果 中 应 包含 的 小 数位 数 ， 对 于 字符 串 转换 来 说 ， 转 换 后 的 值 所 能 包含 的 
最 大 字符 个 数 。 

表示 格式 : 字符 宽度 、 精 度 ， 若 给 出 精度 ， 则 必须 包含 点 号 。 

【 例 5-12】 指定 宽度 。 

students = [{"name":"Wilber", "age":27}, {"name":"Will", "age":28}, {"name":"June", "age":27}] 

print ("name: $10s, age: %10d" %(students[0] ["name"], students[0] ["age"])) 


print ("name: $%-10s, age: %-10d" $%(students[1]["name"], students[1]["age"])) 
print ("name: $%*s, age: %0*d" %$(10, students[2] ["name"], 10, students[2] ["age"])) 


程序 运行 结果 如 图 5-12 所 示 。 
【 例 5-13】 浮 点 数 精度 。 


print('{:.4f}'.format (3.1415926)) 
print('{:0>10.4f}'.format (3.1415926)) 


程序 运行 结果 如 图 5-13 所 示 。 


图 5-12 指定 宽度 结果 图 5-13 浮 点 数 精度 结果 
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5.2.3 对齐 和 用 0 填充 


字符 串 对 齐 有 多 种 方法 ， 这 里 介绍 两 种 方法 。 

第 一 种 : 字符 ^、<、> 分 别 是 居中 、 左 对 齐 、 右 对 齐 ， 后 面 带宽 度 。 
【 例 5-14】 使 用 字符 ^、<、> 进 行 数据 的 对 齐 。 
print('{:>8}'.format ('3.14')) 

print('{:<8}'.format ('3.14')) 

print('{:^8}"'.format('3.14')) 


程序 运行 结果 如 图 5-14 所 示 。 

第 二 种 : 在 Python 中 打印 字符 串 时 可 以 调用 jast ( 左 对 齐 )、rust ( 右 对 齐 ) 和 center (中 间 对 齐 ) 来 
输出 整齐 美观 的 字符 串 。 

如 果 希 望 字符 串 的 长 度 固定 ， 给 定 的 字符 串 又 不 够 长 度 ， 可 以 通过 rjust、ljust 和 center 三 个 方法 来 给 
字符 串 补 全 空格 。rjust 为 向 右 对 齐 ， 在 左边 补 空格 ; ljust 为 向 左 对 齐 ， 在 右边 补 空格 ，center 为 让 字符 串 居 
中 ， 在 左右 补 空格 。 

【 例 5-15】 调 用 ljust0、rjustO0、center0 函 数 进行 数据 的 对 齐 。 


print("3.14".rjust (10)) 
print ("3.14".1just (10)) 
print ("3.14".center (10)) 


程序 运行 结果 如 图 5-15 所 示 。 


图 5-14 ”使 用 字符 ^、<、> 对 齐 结果 图 5-15 调用 函数 对 齐 结果 


同样 ， 用 0 填充 也 有 多 种 方法 ， 下 面 介绍 两 种 。 
第 一 种 ， 使 用 :号 后 面 带 填充 的 字符 ， 只 能 是 一 个 字符 ， 若 无 指定 则 默认 是 用 空格 填充 。 
【 例 5-16】 使 用 :号 进行 0 填充 。 


print('{:0>8}'.format ('3.14')) 
print('{:0>20}'.format ('3.14')) 


程序 运行 结果 如 图 5-16 所 示 。 

第 二 种 : zfill0 方 法 返回 指定 长 度 的 字符 串 ， 原 字符 串 右 对 齐 ， 前 面 填充 0。 

zfill0 方 法 语法 : str.zfill(width)。 参 数 width 指定 字符 串 的 长 度 。 原 字符 串 右 对 齐 ， 前 面 填充 0。 返 回 指 
定 长 度 的 字符 串 。 

【 例 5-17】 使 用 zfill0 函 数 进行 0 填充 。 


str = "3.14" 
print (str.zfil1 (8)) 
print (str.zfill (20)) 


程序 运行 结果 如 图 5-17 所 示 。 


图 5-16 使 用 :号 进行 0 填充 结果 图 5-17 使 用 函数 进行 0 填充 结果 
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运算 符 包 括 算术 运算 符 、 赋 值 运 算 符 、 比 较 运算 符 、 逻 辑 运 算 符 、 按 位 运算 符 、 成 员 运 算 符 和 身份 运 


算术 运算 符 
算术 运算 符 包 括 加 、 减 、 乘 、 除 、 取 余 、 取 整 、 吕 运算 。Python 常见 的 算术 运算 符 见 表 5-3。 


表 5-3 算术 运算 符 
运算 符 说 明 
生 两 个 对 象 相 加 
2 | 得 到 负数 或 是 一 个 数 减 去 另 一 个 数 
+ | 两 个 数 相 乘 或 是 返回 一 个 被 重复 若干 次 的 字符 中 
/ xX 除 以 y 
返回 除法 的 余数 
返回 x 的 y 次 吉 
返回 商 的 整数 部 分 (向 下 取 整 ) 
【 例 5-18】 算术 运算 符 及 表达 式 举例 。 


2 

b = 10 

上 

c=a+b 

Priot (m1 = © 的 村 为 => 
-四 

print ("2 - c 的 值 为 : "，c ) 
er 

print ("3 - c 的 值 为 : "，c ) 
c= a /hb 

print ("4 - c 的 值 为 : "，c ) 
ee 

print ("5 - c 的 值 为 : "，c) 
a= 2 # 修改 变量 a 、b 、c 
b =3 

c= ap 

print ("6 - c 的 值 为 : "，c) 
d= 0 

b=5 

c=a/l/b 


print ("7 - c 的 值 为 : "，c) 
程序 运行 结果 如 图 5-18 所 示 。 


5.3.2 ”赋值 运算 符 
赋值 运算 符 除了 一 般 的 赋值 运算 符 (=) 外 ， 还 包括 =、 一 、*=、 上 等 .Python 常见 的 赋值 运算 符 见 表 5-4。 


图 5-18 ”算术 运算 符 举例 结果 
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表 5-4 赋值 运算 符 

运 算 符 说 明 实 例 
二 简单 的 赋值 运算 符 c=a+b， 将 a+b 的 运算 结果 赋值 为 c 
二 加 法 赋值 运算 符 ct=a 等 效 于 c=c+a 
一 减法 赋值 运算 符 < 一 a 等 效 于 c=c-a 
二 乘法 赋值 运算 符 cta 等 效 于 c=c*a 
大 除法 赋值 运算 符 c 广 a 等 效 于 c=c/a 
%= 取 模 赋值 运算 符 c %=a 等 效 于 c=c%a 
下 二 办 赋值 运算 符 C4=a 等 效 于 c=c**a 
人 取 整 除 赋值 运算 符 c// 三 a 等 效 于 c=c//a 

【 例 5-19】 赋 值 运算 符 及 表达 式 举例 。 

DZ 

b = 10 

er 

c=a+t+b 

print ("1 - c 的 值 为 : "，c) 

c += a 

Print("2 - c 的 值 为 : "，c ) 

print ("3 - c 的 值 为 : "，c ) 

i 

print ("4 - c 的 值 为 : "，c ) 

c=2 

EE 

print ("5 - c 的 值 为 ; "，c) 

C #4= a 

print ("6 - c 的 值 为 : "，c) 

c /in a 


print ("7 - c 的 值 为 : "，c) 
程序 运行 结果 如 图 $-19 所 示 。 


5.3.3 ”比较 运算 符 


比较 运算 符 有 = 一、!=、>、<、>=、<=。 比 较 运算 符 可 以 对 两 个 数据 进行 比较 。Python 常见 的 比较 运算 
符 见 表 5-5 (其 中 ,a =2, b=3)。 


[a 
§ 


表 5-5 比较 运算 符 
比较 对 象 是 否 相等 (a 一 b) 返回 False 
= 比较 两 个 对 象 是 否 不 相等 | (=b) 返回 Tme 
> 比较 x 是 否 大 于 y | (a>b) 返回 False 
< 比较 x 是 否 小 于 y | (a<b 返回 Tme 
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续 表 
运 算 符 说 ” 明 举 例 
> 比较 x 是 否 大 于 等 于 y (a>=b) 返回 False 
= 比较 x 是 否 小 于 等 于 y (a<=b) 返回 True 


print ("1 - a 等 于 b") 


else: 

print ("1 - a 不 等 于 b") 
EE 

print ("2 - a 不 等 于 b") 
else: 

print ("2 - a 等 于 b") 
if a <b 

Brint ("3 — a 小 于 b*) 
else: 

print ("3 - a 大 于 等 于 b") 
if A.> bs 

Print ("a 
else: 

print ("4 - a 小 于 等 于 b") 
a # 修改 变量 a 和 b 的 值 
b= 20 


A Ds 
print ("5 - a 小 于 等 于 b") 


else: 

print ("5 - a 大 于 b") 
ED > 

print ("6 - b 大 于 等 于 a") 
else: 


print ("6 - b 小 于 a") 
程序 运行 结果 如 图 5-20 所 示 。 


: 5.3.4 ”逻辑 运算 符 


逻辑 运算 符 有 and、or 和 not。 逻辑 运算 符 可 以 对 两 个 数据 逻辑 运算 。Python 的 逻辑 运算 符 见 表 5-6 (其 
中 ，a=10，b=10)。 


5-20 ”比较 运算 符 举例 结果 


表 5-6 ”逻辑 运算 符 
运 算 符 说 明 | 举 例 
and 如 果 x 为 False，x andy 返回 False， 否 则 返回 y 的 计算 什 | (aandb) 返回 20 
or 如 果 x 是非 0， 返 回 x 的 值 ， 否 则 返回 y 的 计算 值 | (aorb) 返回 lo0 
not 如 果 x 为 True， 返 回 False。 如 果 x 为 False， 返 回 True not (aandb) 返回 False 


【 例 5-21】 逻 辑 运算 符 及 表达 式 举例 。 
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a= 10 
b= 20 
if aandb: 
print( "1 - 变量 a 和 Pb 都 为 truen) 
else: 
print ("1 - 变量 a 和 b 有 一 个 不 为 true") 
aor Ds 
print ("2 - 变量 a 和 b 都 为 true, 或 其 中 一 个 变量 为 true") 
else: 
print("2 - 变量 a 和 b 都 不 为 true") 
a= 0 # 修改 变量 a 的 值 
if a andb : 
Print("3 - 变量 a 和 Pb 都 为 true") 
else: 
print ("3 - 变量 a 和 b 有 一 个 不 为 true") 
if aorb: 
print ("4 - 变量 a 和 b 都 为 true, 或 其 中 一 个 变量 为 true") 
else: 
print ("4 - 变量 a 和 b 都 不 为 true") 
if not( a and b ): 
print ("5 - 变量 a 和 b 都 为 false, 或 其 中 一 个 变量 为 false") 
else: 
print ("5 - 变量 a 和 Pb 都 为 true") 


程序 运行 结果 如 图 5-21 所 示 。 


5.3.5” 按 位 运算 符 : 各 


图 5-21 逻辑 运算 符 举例 结果 


按 位 运算 符 是 把 数字 看 作 二 进 制 来 进行 计算 的 。 

Python 的 按 位 运算 符 见 表 5-7。 表 5-7 中 变量 a 为 60，b 为 13， 二 进 制 格式 如 下 。 
a = 0011 1100 

b = 0000 1101 

agb = 0000 1100 

alb = 0011 1101 

a^b = 0011 0001 

~a = 1100 0011 


表 5-7” 按 位 运算 符 


参与 运算 的 两 个 值 ， 如 果 两 个 相应 位 都 为 1， 则 该 位 
的 结果 为 1， 否则 为 0 
只 要 对 应 的 两 个 二 进 制 位 有 一 个 为 1 时 ， 结 果 位 就 
为 1 
当 两 个 对 应 的 二 进 制 位 相 异 时 ， 结 果 为 1 
对 数据 的 每 个 二 进 制 位 取 反 ， 即 把 1 变 为 0， 把 0 变 
为 1。~x 类 似 于 一 x-1 


(a &&b) 输出 结果 12， 二 进 制 ， 0000 1100 


(alb) 输出 结果 61， 二 进 制 ， 0011 1101 


(a^b) 输出 结果 49 ， 二 进 制 ， 0011 0001 


(~a) 输出 结果 -61， 二 进 制 ， 1100 0011 
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续 表 
运 算 符 说 明 举 例 
左 移动 运算 符 : 运算 数 的 各 二 进 制 位 全 部 左 移 若干 
< 位 , 由 << 右 边 的 数字 指定 了 移动 的 位 数 , 高 位 丢弃 ， | a << 2 输出 结果 240， 二 进 制 : 1111 0000 
低位 补 0 


右 移动 运算 符 ， 把 ">>" 左 边 的 运算 数 的 各 二 进 制 位 全 
部 右 移 若 干 位 ，>> 右 边 的 数字 指定 了 移动 的 位 数 


> a>>2 输 出 结果 15， 二 进 制 ，0000 1111 


【 例 5-22】 按 位 运算 符 及 表达 式 举例 。 


a= 60 # 60 = 0011 1100 
b= 13 # 13 = 0000 1101 
Se 

c=ag&Db; # 12 = 0000 1100 
print ("1 - c 的 值 为 : "，c) 

Cr= a by #4 61 = 0011 1101 
print ("2 - c 的 值 为 : "，c) 

Cea by # 49 = 0011 0001 
print ("3 - c 的 值 为 : "，c) 

SET 汪 衣 #4 -61 = 1100 0011 
print ("4 - c 的 值 为 : "，c) 

c=a <<2; # 240 = 1111 0000 
print ("5 - c 的 值 为 : "，c) 
c=a>>2; # 15 = 0000 1111 


print ("6 - c 的 值 为 : "，c) 
程序 运行 结果 如 图 5-22 所 示 。 


图 5-22 ” 按 位 运算 符 举例 结果 


成 员 运 算 符 有 in 和 notinp， 它 们 可 以 确定 一 个 值 是 否 是 另 一 个 值 的 成 员 。Python 的 成 员 运 算 符 见 表 5-8。 


表 5-8 成 员 运算 符 

举 例 

如 果 在 指定 的 序列 中 找到 值 返回 Tme， 否 则 返回 False Xiny， 如 果 x 在 y 序列 中 返回 Tme 

如 果 在 指定 的 序列 中 没有 找到 值 返 回 True, 否则 返回 False | xnotiny， 如 果 x 不 在 y 序 列 中 返回 True 


【 例 5-23】 成 员 运 算 符 及 表达 式 举例 。 
a= 0 
b = 20 
RE mL 2 A A LS 
证 (a dn st 

print ("1 - 变量 a 在 给 定 的 列表 中 1ist 中 ") 
else: 

print ("1 - 变量 a 不 在 给 定 的 列表 中 1ist 中 ") 
if ( b not in list ): 

print ("2 - 变量 b 不 在 给 定 的 列表 中 1ist 中 ") 
else: 

print ("2 - 变量 b 在 给 定 的 列表 中 1ist 中 ") 
a=2 #4 修改 变量 a 的 值 


if (a in list ): 
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print ("3 - 变量 a 在 给 定 的 列表 中 1ist 中 ") 


else: 


print ("3 - 变量 a 不 在 给 定 的 列表 中 1ist 中 ") 
程序 运行 结果 如 图 5-23 所 示 。 


图 5-23 成 员 运算 符 举例 结果 


5.3.7 身份 运算 符 
身份 运算 符 有 is 和 is not。Python 的 身份 运算 符 见 表 5-9。 


表 5-9 身份 运算 符 
运 算 说 明 举 例 

判断 两 个 标识 符 是 丰 Xisy， 类 似 id(x) 一 id(y),， 如 果 引 用 的 是 同一 个 对 象 则 返回 True， 否则 
a 一 个 对 象 返回 False 
判断 两 个 标识 符 是 不 是 引用 自 | x is not y， 类 似 id(x)!= id(y)。 如 果 引用 的 不 是 同一 个 对 象 则 返回 结果 
wnt 不 同 对 象 Tme， 否 则 返回 False 

【 例 5-24】 身 份 运算 符 及 表达 式 举例 。 

20 

b= 20 


if (Ca is bD )s 

print ("1 - a 和 b 有 相同 的 标识 ") 
else: 

print ("1 - a 和 b 没有 相同 的 标识 ") 
if (ais not b): 


print("2 - a 和 b 没有 相同 的 标识 ") 


else: 
print ("2 - a 和 b 有 相同 的 标识 ") 
b=30 # 修改 变量 b 的 什 


EC hs 

print ("3 - a 和 b 有 相同 的 标识 ") 
else: 

print ("3 - a 和 b 没有 相同 的 标识 ") 
A 0 not Db )s 

print ("4 - a 和 b 没有 相同 的 标识 ") 
else: 


print ("4 - a 和 b 有 相同 的 标识 ") 
程序 运行 结果 如 图 5-24 所 示 。 


图 5-24 身份 运算 符 举 例 结果 


5.3.8 ”Python 运算 符 优先 级 
Python 有 很 多 运算 符 , 这 些 运算 符 的 优先 级 顺序 是 什么 样 的 呢 ? 表 5-10 列 出 了 从 最 高 到 最 低 优 先 级 的 
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所 有 运算 符 。 
表 5-10 ”Python 运算 符 优先 级 
运 算 符 说 明 
4 指数 〈 最 高 优先 级 ) 
A 按 位 翻转 、 一 元 加 号 和 减 号 (最 后 两 个 的 方法 名 为 +@ 和 -@) 
*/%// 乘 、 除 、 取 模 和 取 整 除 
+— 加 法 、 减 法 
>> << 右 移 、 左 移 运算 符 
& 位 'AND' 
4 位 运算 符 
<=<>> 比较 运算 符 
= 等 于 运算 符 
了 人 人 全 一 全 | 赋值 运算 符 
isis not 身份 运算 符 
innot in 成 员 运 算 符 
not and or 逻辑 运算 符 


5.4 ”就 业 面试 技巧 与 解析 


在 面试 中 ， 面 试 官 问 的 问题 基本 上 都 是 学 过 的 知识 ， 他 们 通常 会 换个 方式 进行 提问 ， 有 的 应 聘 者 可 能 
对 这 个 问题 感觉 不 是 特别 熟悉 ， 但 换个 思路 再 去 想 想 ， 豁 然 开朗 。 让 我 们 来 看 一 下 下 面 是 如 何 回答 的 吧 。 


5.4.1 面试 技巧 与 解析 (一) 
面试 官 : 如 何 用 Python 来 进行 查询 和 蔡 换 一 个 文本 字符 串 ? 


应 聘 者 : 可 以 使 用 sub() 方 法 来 进行 查询 和 替换 。sub( 方 法 的 格式 为 sub(replacement,string[,count=0])， 
replacement 是 被 替换 成 的 文本 ，string 是 需要 被 替换 的 文本 ，count 是 一 个 可 选 参 数 ， 指 最 大 被 替换 的 数量 。 


5.4.2 ”面试 技巧 与 解析 (二 ) 
面试 官 : python 中 “is” 和 “一 ”的 区 别 ? 


应 聘 者 : 


(1) Python 中 对 象 包 含 的 三 个 基本 要 素 分 别 是 : id (身份 标识 )、type (数据 类 型 ) 和 value ( 值 )。 
(2) 一 比较 的 是 value 值 。 
(3) is 比较 的 是 id。 
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第 6 章 
控制 流程 和 控制 语句 


二 > 学 习 指引 


Python 编程 中 对 程序 流程 的 控制 主要 是 通过 条 件 判 断 、 循 环 控制 语句 及 continue、break 来 完成 的 ， 其 
中 ， 条 件 判断 语句 按 预先 设 定 的 条 件 执行 程序 ， 包 括 计 语句、 让 识 套 语句 等 而 循环 控制 语句 则 可 以 重复 
完成 任务 ， 包 括 while 语句 和 for 语句 。 本 章 将 重点 学 习 Python 中 分 支 结构 控制 语句 和 循环 控制 语句 的 使 
用 方法 和 技巧 。 


x” 重点 导读 


* Python 程序 的 结构 和 流程 图 。 

。 掌 握 分 支 结构 的 使 用 方法 。 

。 能 熟练 运用 让 语句 的 分 支 结构 。 

。 掌 握 程序 循环 控制 语句 结构 。 

。 热 练 运用 for 语句 和 while 语句 实现 循环 结构 控制 。 
*。 能 运用 循环 辅助 语句 完成 程序 的 跳 转 。 

。pass 语句 。 


。 程 序 的 异常 处 理 。 


6.1 结构 化 程序 设计 


现实 生活 中 的 流程 是 多 种 多 样 的 ， 如 汽车 在 道路 上 行驶 ， 要 顺序 地 沿 道路 前 进 ， 碰 到 交叉 路 口 时 
了 驶 员 就 需要 判断 是 转弯 还 是 直 走 ， 在 环 路 上 是 继续 前 进 ， 还 是 需要 从 一 个 出 口 出 去 ， 等 等 。 
在 编程 世界 中 遇 到 这 些 状 况 时 ， 要 想 改变 程序 的 执行 流程 ， 就 要 用 到 流程 控制 和 流程 控制 语句 。 


(1) 自 项 向 下 逐步 求 精 的 方法 符合 人 类 解决 复杂 问题 的 普遍 规律 ， 因 此 可 以 显著 提高 程序 开发 工程 的 
成 功率 和 生产 率 。 
(2) 用 先 全 局 后 局 部 、 先 整体 后 细节 、 先 抽象 后 具体 的 逐步 求 精 过 程 开发 出 的 程序 有 清晰 的 层次 结构 ， 
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因此 容易 阅读 和 了 解 。 

(3) 控制 结构 有 确定 的 逻辑 模式 ， 编 写 程序 代码 只 限于 使 用 很 少 几 种 直截了当 的 方式 ， 因 此 源 程序 清 
晰 流畅 ， 易 读 易 懂 ， 而 且 容 易 测 试 。 

0 

(5) 程序 的 逻辑 结构 清晰 ， 有 利于 程序 正确 性 证 明 。 


6.2 ”结构 化 的 程序 流程 图 


序 的 运行 顺序 是 通过 执行 程序 流程 控制 语句 实现 的 。 在 开发 程序 前 ， 通 常 需要 绘制 出 程序 的 运行 流 
程 图 ， ee 可 以 清晰 地 查看 程序 的 执行 过 程 。 
程序 流程 图 是 用 一 系列 图 形 、 流 程 线 和 文字 说 明 等 方式 ， 描 述 程序 的 基本 操作 和 控制 流程 ， 流 程 图 是 
对 程序 分 析 和 过 程 描述 的 最 基本 方式 。 


6 .2.1 程序 流程 图 常用 的 基本 元 素 


绘制 程序 流程 图 的 过 程 中 ， 常 用 的 流程 图 元 素 包括 : 起 止 框 、 判 断 框 、 处 理 框 、 输 入 /输出 框 、 子 程序 
框 、 enemy 合理 规范 地 使 用 流程 图 的 基本 元 素 能 增强 流程 图 的 易 读 性 和 流通 性 ， 如 表 6-1 所 示 。 
表 6-1 流程 图 常用 基本 元 素 
元 素 形 状 元 素 名 称 元 素 介绍 
起 止 框 程序 的 开始 或 结束 都 以 此 元 素 样式 为 准 


处 理 框 标识 程序 的 一 组 处 理 过 程 、 一 个 程序 操作 ， 也 称 之 为 一 个 程序 节点 


判断 框 遇 到 不 同 处 理 结果 的 情况 下 ， 采 用 此 符号 连接 分 支流 程 


全 
全 
人/ 输入 输出 杠 。 | 标识 数据 的 输入 或 者 程序 结果 的 输出 
lel 


子 程 序 框 将 流程 中 一 部 分 有 逻辑 关系 的 节点 合成 一 个 子 流程 ， 方 便 主流 频繁 调用 
i 流向 线 用 带 箭头 的 直线 或 者 曲线 形式 ， 标 识 程序 的 执行 路 径 
连接 点 用 来 将 任意 节点 或 多 个 流程 图 连接 起 来 , 构成 一 个 大 的 流程 图 。 常 用 于 将 大 流 
~ 程 图 分 解 为 多 个 小 流程 图 的 连接 工作 


[ 注释 框 在 流程 图 中 增加 对 语句 、 程 序 段 的 注释 ， 使 流程 图 更 易 懂 


6.2.2 程序 的 流程 图 


在 程序 流程 图 中 ， 不 仅 可 以 采用 连接 点 将 流程 图 分 解 为 两 个 部 分 ， 还 可 以 将 程序 流程 中 执行 相同 的 程 
序 功 能 块 以 子 程序 的 形式 调用 ， 如 图 6-1 所 示 。 
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6-1 综合 流程 图 


6.3 ”程序 运行 的 三 种 基本 结构 


程序 的 运行 可 以 理解 是 在 执行 一 条 一 条 程序 语句 。 但 是 任何 事情 都 会 有 不 同 的 情况 出 现 ， 就 像 去 学 校 
上 课 ， 不 一 定 所 有 的 同学 都 能 走 直线 到 达 学 校 ， 需 要 选择 不 同 的 路 径 才能 到 达 目的 地 。 在 Python 中 ， 顺 序 
结构 是 程序 的 基础 ， 但 是 单一 地 按照 顺序 结构 执行 程序 是 不 能 解决 所 有 问题 的 ， 这 就 需要 引入 程序 控制 结 
构 来 引导 程序 按照 需要 的 顺序 执行 。 基 本 的 处 理 流程 包含 三 种 结构 ， 即 顺序 结构 、 分 支 结构 和 循环 结构 。 
为 了 便于 理解 和 展示 程序 结构 ， 下 面 分 别 采 用 流程 图 方式 展示 。 


6.3.1 顺序 结构 


顺序 结构 就 是 程序 按照 线性 顺序 依次 执行 程序 语句 的 一 种 程序 运行 方式 。 顺 序 
结构 是 Python 程序 中 最 基本 和 最 简单 的 运行 流程 的 结构 ， 如 图 6-2 所 示 ， 它 按照 语 
句 出 现 的 先后 顺序 依次 执行 ， 首 先 执行 语句 1， 之 后 再 执行 语句 2， 依 次 逐条 执行 。 


6.3.2 选择 分 支 结构 


分 支 结构 是 程序 根据 给 定 的 逻辑 条 件 的 不 同 结果 而 选择 不 同 路 径 执行 的 运行 图 6.2 顺序 流程 图 
方式 ， 常 见 的 有 单 向 分 支 和 双向 分 支 。 当然 ， 单 、 双 分 支 结构 也 会 组 合 形成 多 分 支 
结构 。 但 程序 在 执行 过 程 中 都 只 执行 其 中 一 条 分 支 。 单 向 分 支 和 双向 分 支 结构 如 图 6-3 所 示 。 


开始 开始 
Ge TT : | 
| 
| 。 | 可 请 和 和 语句?| 
人 


6-3 选择 分 支 结构 流程 图 
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A 
en 从 入 门 到 项 目 实践 ( 超 值 版 ) 


循环 结构 


到 
语句 1 
Ia | 
是 
循环 体 条 件 判断 1 
否 


6-4 ”while 语句 循环 与 for 语句 循环 图 


6.4 顺序 结构 程序 举例 


对 于 顺序 结构 而 言 ,程序 是 按照 语句 出 现 的 先后 顺序 依次 执行 的 ， 下 面 几 个 例 


子 对 形成 清晰 的 编程 思路 是 有 帮助 的 。 

【 例 6-1】 输入 一 个 三 位 数 整数 n， 输 出 其 逆序 数 m， 例 如 ， 输 入 n=123， 输 出 
m=321。 

n=int (input ("请 输入 一 个 数 : ") ) 

a=n$%10 # 求 个 位 数 

b=n//10%10 # 求 十 位 数 

c=n//100 +# 求 百 位 数 

m=a*100+b*10+c # 求 逆序 数 


print ("逆序 数 是 : ",，m) 


程序 


其 运 
用 户 
使 用 n%1 


运行 结果 如 图 6-5 所 示 。 


图 6-5 ”逆序 数 结果 
行 的 流程 图 如 图 6-6 所 示 。 
输入 一 个 三 位 数 ， 运 用 取 余 运 算 符 “%” 和 整除 运算 符 “//” 实 现 。 例 如 ， 
0 取出 n 的 个 位 数 ， 并 将 其 存 入 a， 使 用 n=n//10 去 掉 n 的 个 位 数 ， 再 用 


1%10 取出 原来 的 n 的 十 位 ， 并 将 其 存 入 b， 用 nW100 取出 其 百 位 数 ， 并 将 其 存 入 
c， 然 后 使 用 m=a*100+b*10tc， 计 算出 道 序数 。 


该 程 


序 是 一 个 顺序 结构 的 程序 ， 程 序 的 执行 过 程 是 按照 书写 语句 ， 一 步 一 步 地 


按 顺序 执行 ， 直 至 程序 结束 。 程 序 运行 首先 需要 用 户 输入 一 个 三 位 数 ， 然 后 程序 开 


始 执行 逆 
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序数 的 计算 ， 最 后 将 运算 结果 输出 。 


: 循环 结构 即 程序 根据 逻辑 条 件 来 判断 是 否 重复 执行 某 一 段 程序 ， 若 逻辑 条 件 成 立 ， 则 进入 循环 重复 执 
行 某 段 程序 ， 若 逻辑 条 件 为 假 ， 则 结束 执行 循环 某 段 程序 的 操作 ， 执 行 后 面 的 


程序 语句 ， 如 图 6-4 所 示 。 


6-6 ”逆序 数 流程 图 


第 加 章 ， 控 制 流程 和 控制 语句 


【 例 6-2】 已 知 一 个 圆柱 体 的 底面 半径 与 高 ， 求 圆柱 体 的 体积 。 


开始 
a=int (input (" 请 输入 底面 半径 : ") ) 
b=int (input (" 请 输入 高 : ") ) 
5=3.14*ata*b 输入 一 个 底 
print(' 国 柱 体 的 体积 是 : '，s) 面积 半径 a 


程序 运行 结果 如 图 6-7 所 示 。 


| 2 


6-7 ”圆柱 体 体积 结果 Y 
其 运行 的 流程 图 如 图 6-8 所 示 。 计算 体积 s 


程序 在 运行 的 时 候 ， 是 按照 顺序 执行 的 ， 先 接收 两 个 值 ， 分 别 作为 圆柱 体 的 底 
面 半径 和 高 ， 传 给 a 和 b， 然 后 利用 圆柱 体 体积 公式 ， 求 出 圆柱 体 的 体积 s， 然 后 输 
出 圆柱 体 的 体积 s。 输出 体积 s 


6.5 “分 支 结构 程序 举例 
图 6-8 圆柱 体 体积 流 

计算 机 要 处 理 的 问题 往往 是 复杂 多 变 的 ， 仅 采用 顺序 结构 是 不 够 的 ， 还 需要 利 程 图 
用 分 支 结构 来 解决 实际 应 用 中 的 各 种 问题 。 在 Python 中 可 以 通过 让 、elif、else 等 条 
件 判断 语句 来 实现 单 分 支 、 双 分 支 和 多 分 支 等 分 支 结构 。 

使 用 分 支 结构 需要 注意 以 下 问题 。 

(1) 每 个 条 件 后 面 要 使 用 冒号 (:)， 表 示 接 下 来 是 满足 条 件 后 要 执行 的 语句 块 。 

(2) 使 用 缩 进 来 划分 语句 块 ， 相 同 缩 进 数 的 语句 在 一 起 组 成 一 个 语句 块 。 

(3) 单 分 支 结构 让 语句 ， 也 可 以 并 列 使 用 多 条 于 语句 实现 对 不 同 条 件 的 判断 。 

(4) 在 Python 中 没有 switch…case 语句 。 

让 语句 的 语句 块 只 有 在 条 件 表达 式 的 结果 的 布尔 值 为 真 时 才 执行 ， 否 则 将 跳 过 语句 块 执行 该 代码 块 后 
面 的 语句 。 

让 语句 中 条 件 部 分 可 以 使 用 任何 能 够 产生 True 或 False 的 语句 形成 判断 条 件 ， 最 常见 的 方式 是 采用 关 
系 操作 符 ，Python 语言 共有 6 个 关系 操作 符 。 表 6-2 为 让 中 常用 的 关系 操作 运算 符 。 


表 6-2 ”Python 的 关系 操作 符 


操作 符 
小 于 


< | 小 于 或 等 于 

> | 二 玉 

一 | > 大 于 或 等 于 

一 | 等 于 ， 比 较 对 象 是 否 相等 


不 等 于 


注意 : 在 Python 中 使 用 单 等 号 “=” 表示 赋值 语句 ， 而 使 用 双 等 号 “===” 表示 等 于 ， 要 注意 区 分 。 
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wu6.5.1 单 分 支 结构 
Sa: 单 分 支 结构 站 语句 主要 由 三 部 分 组 成 :关键 字 站 ， 用 于 判断 结构 真 假 的 条 件 判断 表达 式 ， 以 及 当 表达 式 为 
真 时 执行 的 代码 块 。 站 语句 就 是 对 语句 中 不 同 条 件 的 值 进行 判断 ， 进 而 根据 不 同 的 条 件 执行 不 同 的 分 支 语句 。 
在 Python 中 站 语句 的 语法 格式 如 下 : 
单 分 支 判 断 
if 条 件 : 
条 件 满足 时 ,执行 语句 … 
单 分 支 结构 的 流程 图 如 图 6-9 所 示 。 
下 面 根据 几 个 简单 的 小 例子 ， 来 进一步 了 解 一 下 单 分 支 结 构 。 
【 例 6-3】 输 入 两 个 数 a 和 b， 比 较 它 们 的 大 小 ， 输 出 其 中 的 较 大 数 。a 与 b 不 能 相同 。 
a=int (input ("请 输入 一 个 数 a: ") ) 
b=int (input ("请 输入 另 一 个 数 D: ")) 
if a>b: 
print (" 较 大 数 是 a:",a) 
if a<b: 
print (" 较 大 数 是 b:",b) 
程序 运行 结果 如 图 6-10 所 示 。 
其 运行 的 流程 图 如 图 6-11 所 示 。 


程序 语句 块 
图 6-9 单 分 支 语句 流程 图 6-10 ”输出 较 大 值 结果 图 6-11 输出 较 大 值 流程 图 


该 程序 是 一 个 站 单 分 支 结 构 的 程序 ， 在 执行 过 程 中 会 按照 键盘 输入 两 个 不 同 值 的 大 小 ， 选 择 不 同 的 语 
句 执行 。 这 是 一 个 简单 的 二 段 式 的 单 支 判断 。 

下 面 再 来 看 看 另 一 个 简单 的 小 例子 。 

【 例 6-4】 输入 一 个 学 生 的 成 绩 ， 判 断 其 是 否 及 格 ， 判 断 标 准 是 ， 如 果 输入 的 成 绩 大 于 等 于 60， 则 属 
于 及 格 ， 否 则 为 不 及 格 。 使 用 双 分 支 结构 实现 。 

score=int (input (" 请 输入 一 个 学 生 的 成 绩 : ") ) 


if score>=60: 
print ("其 喜 你 ,你 及 格 了 ") 
if score<60: 


print (" 很 遗憾 ， 你 不 及 格 ") 
程序 运行 结果 如 图 6-12 所 示 。 
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有 兴趣 的 读者 ， 可 以 试 试 画 出 上 面 例子 中 程序 的 流程 图 。 
6.5.2” 双 分 支 结 构 图 6-12 输出 成 绩 结果 


双 分 支 结构 是 有 两 个 分 支 ， 如 果 条 件 成 立 ， 执 行 分 支 1 语句 ， 否 则 执行 分 支 2 语句 ， 分 支 1 语句 和 分 
2 语句 都 可 以 由 一 条 或 多 条 语句 构成 。 在 Python 中 让 .else 语句 用 来 构成 双 分 支 结 构 ， 语 法 格式 如 下 : 
双 分 支 判断 
if 条 件 : 
条 件 满足 时 ,执行 语句 … 
else: 


条 件 不 满足 时 ， 执 行 语 名 … 
双 分 支 结构 的 流程 图 如 图 6-13 所 示 。 


程序 语句 块 1 程序 语句 块 2 


图 6-13 ” 双 分 支 结构 的 流程 图 


下 面 根据 两 个 简单 的 小 例子 ， 来 进一步 了 解 一 下 双 分 支 结构 。 
【 例 6-5】 输 入 一 个 数 ， 如 果 输 入 的 数 比 10 大 ， 则 输出 该 数 。 如 果 输 入 的 数 比 10 小 ， 则 输出 10。 
a=int (input (" 请 输入 一 个 数 : ") ) 
if a>=10: 
print ("你 输入 的 数 比 10 大 : "va) 


else: 


print ("你 输入 的 数 比 10 小 : ",10) 
程序 运行 结果 如 图 6-14 所 示 。 


6-14 ”比较 结果 


其 运行 的 流程 图 如 图 6-15 所 示 。 

该 程序 是 一 个 ff…else 语句 的 双 分 支 结 构 的 程序 , 在 执行 过 程 中 会 判定 输入 的 数 与 10 的 大 小 比较 结果 ， 
而 选择 不 同 的 分 支 语句 执行 。 

【 例 6-6】 输 入 一 个 学 生 的 成 绩 ， 判 断 其 是 否 及 格 ， 判 断 标准 是 : 如 果 输 入 的 成 绩 大 于 等 于 60， 则 属于 
及 格 ， 否 则 为 不 及 格 。 使 用 双 分 支 结构 实现 。 

score=int (input (" 请 输入 一 个 学 生 的 成 绩 : ") ) 
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ws 
if score>=60: 
print (" 蕉 喜 你 ,你 及 格 了 ") 


else: 


print ("很 遗憾 ,你 不 及 格 ") 
程序 运行 结果 如 图 6-16 所 示 。 


开始 
输入 一 个 数 a 
< 
a>=107 
是 
/输出 数 a / / 输出 数 10 / 


图 6-15 与 10 比较 的 流程 图 图 6-16 输出 成 绩 结果 
有 兴趣 的 读者 ， 可 以 试 试 画 出 上 面 例子 中 程序 的 流程 图 。 
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耻 6.5.3 ”多 分 支 结构 


双 分 支 结构 只 能 根据 条 件 表达 式 的 真 或 假 决 定 处 
理 两 个 分 支 中 的 一 个 。 当 实际 处 理 的 问题 有 多 种 条 件 
时 ， 就 需要 用 到 多 分 支 结构 。 在 Python 中 用 if…elif… 
else 描述 多 分 支 结构 ， 语 句 格式 如 下 : 


多 分 支 判断 : 
if 条 件 : 
条 件 满足 时 ,执行 语句 … 


elif 条 件 : 
条 件 满足 时 ,执行 语句 … 


else: 


以 上 条 件 都 不 满足 时 ,执行 语句 … 


>| 语句 块 1 


>| 语句 块 2 


多 分 支 结构 的 流程 图 如 图 6-17 所 示 。 
下 面 根据 两 个 简单 的 小 例子 , 来 进一步 了 解 一 下 双 


分 支 结构 。 

【 例 6-7】 输 入 狗 的 年 龄 ， 求 其 对 应 的 人 类 年 龄 ， 
其 对 应 关系 为 ， 当 狗 的 年 龄 是 1 岁 时 , 对 应 人 类 14 岁 ， 
当 狗 的 年 龄 是 2 岁 时 ， 对 应 人 类 22 岁 ， 当 狗 的 年 龄 大 


>| 语句 块 n 


于 2 岁 时 ， 每 增加 1 岁 ， 对 应 人 类 的 年 龄 就 增加 5 岁 。 


age = int (input ("请 输入 你 家 和 狗 的 年 龄 : ") ) 娃 
print ("") 


if age =—1: 图 6-17 多 分 支 结构 的 流程 图 
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print ("相当 于 14 岁 的 人 。") 
elif age ==-2: 

print ("相当 于 22 岁 的 人 。") 
elif age >2: 

human =22+ (age -2)*5 
print (" 对 应 人 类 年 龄 : "，human) 


程序 运行 结果 如 图 6-18 所 示 。 


图 6-18 狗 对 应 的 年 龄 结果 年 龄 age 
运行 的 流程 图 如 图 6-19 所 示 。 是 

下 面 再 看 看 另 一 个 例子 。 age—1? 对 应 人 类 14 岁 

【 例 6-8】 输 入 一 个 学 生 的 成 绩 , 判断 其 成 绩 的 级 别 ， 否 
判断 标准 是 ， 如 果 输入 的 成 绩 小 于 60， 则 属于 不 及 格 ; Fi 是 | 对 应 人 关 22 岁 
输入 的 成 绩 大 于 等 于 60， 小 于 70， 则 属于 及 格 ; 输入 的 四 
成 绩 大 于 等 于 70， 小 于 80， 则 属于 中 等 ， 输 入 的 成 绩 大 ~ 十 | 
于 等 于 80， 小 于 90, 则 属于 良好 ; 输入 的 成 绩 大 于 等 于 Li (Cage-2)*5 岁 
90， 小 于 等 于 100， 则 属于 优秀 。 使 用 多 分 支 结构 实现 。 

score = int (input ("请 输入 学 生成 绩 : ") ) 

print ("") 结束 

a 图 6-19 输出 狗 的 年 龄 流程 图 


elif 60<=score<70: 
print ("及 格 。") 
elif 70<=score<80: 
print ("中 等 。") 
elif 80<=score<90: 
print ("良好 。") 
else: 
print ("优秀 ! ") 


程序 运行 结果 如 图 6-20 所 示 。 


图 6-20 成绩 等 级 结果 

在 使 用 多 分 支 结构 时 要 注意 以 下 问题 。 

(1) 无 论 有 多 少 个 分 支 ， 程 序 执行 了 一 个 分 支 后 ， 其 余 分 支 不 再 执行 。 

(2) elif 不 能 写成 elseif。 

(3) 当 多 分 支 中 有 多 个 表达 式 同 时 满足 时 ， 则 只 执行 第 一 个 与 之 匹配 的 语句 块 。 因 此 ， 要 注意 多 分 支 
中 表达 式 的 书写 次 序 ， 防 止 某 些 值 的 过 滤 。 

多 分 支 结构 是 二 分 支 结构 的 扩展 ， 这 种 形式 通常 用 于 设置 同一 个 判断 条 件 的 多 条 执行 路 径 。Python 测 
试 条 件 的 顺序 为 条 件 表 达 式 1、 条 件 表达 式 2、…… 一 旦 遇 到 某 个 条 件 表 达 式 为 真 的 情况 ， 则 执行 该 条 件 下 
的 语句 块 ， 然 后 跳出 分 支 结构 。 如 果 没 有 条 件 为 真 ， 则 执行 else 下 面 的 语句 块 。 语 句 的 作用 是 根据 表达 式 
的 值 确定 执行 哪个 语句 块 。 
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.6.5.4 “if 语句 嵌 套 结构 


在 柑 套 站 语句 中 ， 可 以 把 站 …elif…else 结构 放 在 另外 一 个 直 …elif…else 结构 中 。 语 法 格式 如 下 : 
每 一 个 "执行 语句 …" 位 置 ， 都 可 以 再 次 写 判 断 语句 
if 条 件 1: 
if 条 件 2: 
条 件 满足 时 ,执行 语句 … 


条 件 不 满足 时 ,执行 语句 … 


else: 


else: 
if 条 件 2: 
条 件 满足 时 ,执行 语句 … 
条 件 不 满足 时 , 执行 语句 … 
下 面 根据 一 个 简单 的 小 例子 ， 来 进一步 了 解 一 下 站 语句 嵌 套 结构 。 
【 例 6-9】 输 入 一 个 数 ， 判 断 输 入 的 数字 能 否 整除 2 或 3， 并 给 出 运算 结果 。 程 序 首先 判断 数值 能 否 整 


else: 


除 2， 如 果 能 整除 ， 再 判断 是 否 能 整除 3， 如 二 次 判断 均 成 立 则 给 出 该 数 能 同时 整除 2 和 3 并 输出 提示 ， 否 
则 仅 给 出 能 整除 2 的 输出 提示 。 当 第 一 个 判断 整除 2 不 成 立时 ， 则 判断 是 否 能 整除 3， 如 判断 成 立 则 说 明 
能 整除 3 不 能 整除 2， 否则 给 出 该 数值 不 能 整除 2 和 3。 


国光 2 加 


num=int (input (" 输 入 一 个 数字 : ") ) 
if num%2==0: 
if num%3==0: 
print ("你 输入 的 数字 可 以 整除 2 和 3") 
else: 


print ("你 输入 的 数字 可 以 整除 2, 但 不 能 整除 3") 


if num%3==0: 


print ("你 输入 的 数字 可 以 整除 3, 但 不 能 整除 2") 


else: 


print ("你 输入 的 数字 不 能 整除 2 和 3") 
程序 运行 结果 如 图 6-21 所 示 。 


图 6-21 整除 结果 


时 6 .5.5 ”多重 条 件 判断 


在 Python 编程 中 , 经 常会 遇 到 多 重 条 件 比 较 的 情况 。 在 多 重 条 件 比较 时 , 需要 用 到 and 或 者 or 运算 符 。 
注意 以 下 问题 。 

(1) and 一 一 A and B: 表示 A 和 了 B 两 个 条 件 必须 同时 满足 才 可 以 执行 。 

(2) or 一 一 A or B: 表示 A 或 B， 两 个 条 件 只 要 满足 其 中 的 任意 一 个 ， 就 可 以 执行 。 

下 面 根据 一 个 简单 的 小 例子 ， 来 进一步 了 解 一 下 多 重 条 件 判断 结构 。 

【 例 6-10】 输 入 一 个 年 龄 ， 根 据 年 龄 段 来 判断 要 办 什么 样 的 卡 。 青 年 卡 或 老年 卡 标准 是 18 岁 及 以 下 或 


60 岁 以 上 。 其 他 年 龄 是 中 年 卡 ， 本 例 要 实现 输入 一 个 年 龄 值 ， 首 先 判断 是 否 是 有 效 年 龄 ， 然 后 再 判断 该 年 
龄 要 办 什么 样 的 卡 。 


084 


age=int (input (" 请 输入 您 的 年 龄 : ") ) 
if age <=1 and age >=100: 
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print ("请 你 重新 输入 年 龄 ! ") 
if age >=60 or age<=18: 
print ("老年 卡 或 青年 卡 ") 


else: 
print ("中 年 卡 ") 
程序 运行 结果 如 图 6-22 所 示 。 


2 


6-22 ”判断 结果 


6.6 ”循环 结构 程序 举例 


循环 语句 主要 就 是 在 满足 条 件 的 情况 下 反复 执行 某 一 个 操作 。 根 据 循环 执行 次 数 的 确定 性 ， 循 环 可 以 
分 为 确定 次 数 循环 和 不 确定 次 数 循环 。 确 定 次 数 循环 指 循环 体 对 循环 次 数 有 明确 的 定义 ， 循 环 次 数 限制 采 
用 遍历 结构 中 元 素 个 数 来 体现 ， 也 称 有 限 循环 ， 在 Python 中 称 之 为 遍历 循环 〈for 语句 )， 不 确定 次 数 循环 
被 称 为 无 限 循环 ， 在 Python 中 用 while 语句 实现 。 


6.6.1 while 循环 结构 


while 循环 判断 比较 简单 ， 当 条 件 判 断 为 True 时 ， 循 环 体 就 会 去 重复 执行 语句 块 中 的 语句 ， 当 条 件 判 
断 为 False 时 ， 则 终止 循环 语句 的 执行 ， 同 时 去 执行 与 while 同 级 别 的 后 续 语 句 。 其 格式 如 下 : 

while < 循环 条 件 >: 

< 语句 块 > 语句 块 

下 面 通过 一 个 例子 来 看 看 while 循环 。 

【 例 6-11】 输入 一 个 运算 数 ， 然 后 将 这 个 数 乘 以 2， 循环 5 次 。 


a=5 
b=int (input (" 请 输入 一 个 数 : ") ) 
while a>0: 
b=b*2 
print ("b 的 值 是 : ",b) 
a=a-l1 


print ("程序 结束 ") 
程序 运行 结果 如 图 6-23 所 示 。 


图 6-23 循环 5 次 结果 
其 运行 的 流程 图 如 图 6-24 所 示 。 


在 while 中 使 用 else 语句 ， 其 格式 如 下 : 


while < 循环 条 件 >: 
< 语句 块 1> 


else: 
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< 语句 块 2> 
【 例 6-12】 输 入 一 个 小 于 5 的 数 ， 每 次 加 1， 直 到 其 不 小 于 5 为 止 。 
a=int (input (" 请 输入 一 个 数 : ")) 
While a<5: 
print (av "小 于 5") 


print (a, "不 小 于 5") 
程序 运行 结果 如 图 6-25 所 示 。 


6-25 ”程序 执行 结果 


.6.2 for 循环 结构 


for 语句 通常 由 两 部 分 组 成 ， 一 是 条 件 控制 部 分 ， 二 是 循环 部 分 。for 语句 语法 格式 如 下 所 示 。 
for < 循环 变量 > in < 遍历 结构 >: 
语句 块 1 
else: 
语句 块 2 
其 中 ，“ 循 环 变量 ”是 一 个 变量 名 称 ，“ 饥 历 结构 ” 则 是 一 个 列表 。 在 Python 中 for 语句 之 所 以 称 为 “ 遍 
历 循环 ” 是 因为 for 语句 执行 的 次 数 是 由 “遍历 结构 ”中 元 素 的 个 数 决定 的 。 遍 历 循 环 就 是 依次 从 “遍历 
结构 ”中 取出 元 素 ， 置 入 循环 变量 中 ， 并 执行 对 应 的 语句 块 。“ 遍 历 结 构 ” 可 以 是 字符 串 、 文 件 、 组 合 数据 
类 型 或 range0 函 数 。else 语句 只 在 循环 正常 执行 并 结束 时 才 执 行 。else 语句 通常 是 被 省 略 的 。 
【 例 6-13】 定 义 一 个 字符 串 ， 然 后 使 用 for 语句 遍历 字符 串 。 
TIE | 
for index in range(len(a)) : 
print (' 当 前 数字 是 :'，a[index]) 


程序 运行 结果 如 图 6-26 所 示 。 


图 6-26 循环 遍历 结果 


【 例 6-14】 定 义 一 个 链表 ， 将 链表 里 面 的 数字 按 大 小 顺序 从 小 到 大 输出 。 


# 冒 泡 排 序 
# 定义 列表 1ist 
arays = [1,2,6,8,3,9,4] 
for i in range(len(arays)): 
for j in range (i+1): 
if arays[i] < arays[j]: 
arays[i],arays[j] = arays[j],arays[i]  ”# 实 现 两 个 变量 的 互 换 


print (arays) 


程序 运行 结果 如 图 6-27 所 示 。 
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[2 3 4 6 38, 9] | 
6-27 ”排序 结果 


6.6.3 break 和 continue 语句 


到 

在 程序 运行 过 程 中 ， 根 据 程序 的 目的 ， 有 时 需要 程序 在 满足 另 一 个 特定 条 件 时 跳出 本 次 循环 ， 或 者 跳 
出 本 次 循环 去 执行 另外 的 循环 。 在 Python 中 要 实现 循环 的 自由 转 场 就 要 用 到 两 个 辅助 保留 字 : break 和 
continue， 它 们 用 来 辅助 控制 循环 。 

break 语句 可 以 在 循环 过 程 中 直接 退出 循环 ， 而 continue 语句 可 以 提前 结束 本 轮 循 环 ， 并 直接 开始 下 一 
轮 循 环 。 这 两 个 语句 通常 都 必须 配合 让 语句 使 用 。 

要 特别 注意 ， 不 要 滥用 break 和 continue 语句 。break 和 continue 会 造成 代码 执行 逻辑 分 又 过 多 ， 容 易 
出 错 。 大 多 数 循环 并 不 需要 用 到 break 和 continue 语句 ,都 可 以 通过 改写 循环 条 件 或 者 修改 循环 逻辑 ， 去 掉 
break 和 continue 语句 。 

有 些 时 候 ， 如 果 代 码 写 得 有 问题 ， 会 让 程序 陷入 “ 死 循环 ” 也 就 是 永远 循环 下 去 。 这 时 可 以 按 CtritC 
组 合 键 退出 程序 ， 或 者 强制 结束 Python 进程 。 

1. break 语句 

【 例 6-15】 在 银行 取 钱 的 时 候 ， 经 常 看 见 输 入 密码 只 有 三 次 机 会 ， 如 果 三 次 密码 都 输 错 了 ， 那 么 就 输入 
不 了 了 。 我 们 都 知道 ， 这 是 通过 循环 来 判断 账号 与 密码 是 否 匹 配 ， 如 果 输 入 了 对 的 密码 ， 将 使 用 break 跳 
出 循环 。break 语句 可 以 在 循环 过 程 中 直接 退出 循环 。 


Username = 'a' 
password = '123' 
i=0 


while i < 3: 

name = input(' 请 输入 用 户 名 : ') 

pwd = input (' 请 输入 密码 : ') 

if name == username and pwd == password: 
print (' 登 录 成 功 ') 
Break 

else: 
Print (' 用 户 名 或 密码 错误 ') 


> 


程序 运行 结果 如 图 6-28 所 示 。 


图 6-28 登录 账号 结果 
2. continue 语句 
continue 语句 可 以 提前 结束 本 轮 循 环 ， 并 直接 开始 下 一 轮 循 环 。 
【 例 6-16】 在 数字 匹配 游戏 中 ， 可 以 清晰 地 感受 到 break 与 continue 的 不 同 ， 当 匹配 的 数字 是 4 时 ， 在 
结束 循环 时 ， 输 出 的 是 数字 5。 
Ee lt es te el Vn a | 
for a in List: 
Af as="A": 
print ("找到 数字 ! ") 


continue 
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发 过 程 中 ， 如 果 某 个 


print (a) 


程序 运行 结果 如 图 6-29 所 示 。 


pass 是 空 语句 ， 主 要 为 了 保持 程序 结构 的 完整 性 。pass 不 做 任何 事情 ， 一 般 用 作 占 位 语句 。 在 程序 开 
区 块 并 不 想 执 行 任何 程序 语句 ， 以 后 或 许 会 再 编写 什么 程序 语句 ， 就 可 以 在 这 里 先 放 


置 一 个 pass 来 占 个 位 。 
【 例 6-17】for 和 pass 语句 配合 使 用 。 


for a in "努力 学 习 " 
if a == "学 ': 
pass 


6-29 ”字符 匹配 结果 


6.7 pass 语句 


print (' 执 行 pass 语句 ') 
print (' 当 前 输出 是 :'，a) 


程序 运行 结果 如 图 6-30 所 示 。 


图 6-30 ”pass 语句 结果 


6.8 程序 的 异常 处 理 


程序 的 异常 处 理 的 写法 和 处 理 方式 有 以 下 三 种 。 
(1) 最 简单 最 直接 的 处 理 方式 ;假定 在 写 代码 的 时 候 ， 有 时 怕 程 序 会 出 问题 ， 就 会 在 可 能 出 问题 的 地 
方 用 上 try exception 来 捕获 程序 出 现 的 错误 。 


try: 
mai/d 

except Exception,e: 
print e 


(2) 在 其 中 加 个 判断 ， 在 写 一 段 程序 的 时 候 ， 想 如 果 有 异常 就 输出 异常 ， 如 果 没 异常 就 继续 执行 下 面 
的 语句 该 怎么 做 呢 ? 就 要 用 到 try exception else。 例 如 : 


try: 
a = 1/2 

except Exception,e: 
print e 

else: 
print 'success' 


输出 的 结果 是 success， 


因 


为 上 面 的 a = 1/2 没有 报错 ， 它 会 执行 else 后 面 的 语句 ， 就 像 Python 控制 语 


句 的 if…else。 如 果 上 面 的 程序 有 异常 就 执行 except 后 面 的 语句 ， 输 出 异常 ， 如 果 没有 异常 的 话 ， 就 会 执行 
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else 后 面 的 语句 。 
(3) 不 管 有 没有 异常 都 要 执行 : 这 个 情况 主要 是 如 果 你 要 操作 什么 东西 ， 例 如 文件 或 者 网 络 等 ， 不 管 
它 是 否 发 生 异 常 最 后 都 要 关闭 资源 ， 例 如 关闭 文件 等 。 
人 = file('l.txt', Ww') 
f.write('fefe') 
except Exception,e: 
print e 
finally: 
f.closel() 
上 面 假设 在 打开 文件 或 者 写 内 容 的 时 候 出 错 的 话 ， 会 执行 print e， 接 着 会 执行 fcloseO 关 闭 文件 ， 
其 实 不 一 定 是 有 异常 才 会 执行 finally 后 面 的 方法 ， 就 算 语句 没有 出 现 异常 的 话 ， 也 会 执行 finally 后 面 
的 语句 。 


6.9 就 业 面试 技巧 与 解析 


面试 技巧 指 的 是 在 面试 时 候 的 技巧 。 面 试 是 你 能 够 得 到 一 份 工作 的 关键 。 内 容 包 括 面试 前 的 准备 工作 、 
面试 当中 应 该 注意 的 问题 、 在 面试 中 如 何 回答 面试 管 的 问题 ， 以 及 如 何在 面试 中 推销 自己 等 。 

面试 是 一 个 短 时 交流 的 过 程 ， 这 个 过 程 中 包含 首 因 效应 的 管理 ， 晕 轮 效应 的 管理 ， 如 何 做 好 面试 管理 
对 求职 者 至 关 重 要 。 下 面 来 了 解 一 下 在 面试 中 如 何 简洁 地 回答 面试 官 的 问题 。 


6.9.1 面试 技巧 与 解析 (一) 


面试 官 : Python 中 pass 语句 的 作用 是 什么 ? 

应 聘 者 : 

(1) pass 语句 什么 也 不 做 ， 一 般 作 为 占 位 符 或 者 创建 占 位 程序 ，pass 语句 不 会 执行 任何 操作 。 
(2) pass 通常 用 来 创建 一 个 最 简单 的 类 。 

(3) pass 在 软件 设计 阶段 也 经 常用 来 作为 TODO， 提 醒 实现 相应 的 实现 。 


6.9.2 ”面试 技巧 与 解析 (二) 


面试 官 : 介绍 一 下 except 的 用 法 和 作用 。 

应 聘 者 : try*…except…except…[else…][finally…] 

执行 try 下 的 语句 ， 如 果 引 发 异常 ， 则 执行 过 程 会 跳 到 except 语句 。 对 每 个 except 分 支 顺序 尝试 执行 ， 
如 果 引 发 的 异常 与 except 中 的 异常 组 匹配 ， 执 行 相应 的 语句 。 如 果 所 有 的 except 都 不 匹配 ， 则 异常 会 传递 
到 下 一 个 调用 本 代码 的 最 高 层 ty 代码 中 。 

try 下 的 语句 正常 执行 ， 则 执行 else 块 代码 。 如 果 发 生 异常 ， 就 不 会 执行 。 如 果 存 在 finally 语句 ， 最 后 
总 是 会 执行 。 
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在 本 章 中 ， 将 学 习 编写 函数 ， 函 数 是 带 名 字 的 代码 块 ， 用 于 完成 具体 的 工作 。 前 面 章节 编写 的 代码 大 
多 是 从 上 到 下 依次 执行 的 ， 但 是 如 果 某 段 代码 需要 多 次 使 用 ， 那 么 就 要 将 该 段 代码 复制 多 次 ， 这 种 做 法 会 
使 代码 变 得 腑 肿 ， 而 且 影响 开发 效率 ， 在 实际 项 目 开发 中 是 不 可 取 的 。 为 了 解决 这 种 问题 ， 在 Python 中 可 
以 把 实现 某 一 功能 的 代码 定义 为 一 个 函数 ， 然 后 在 需要 使 用 时 调用 该 函数 即 可 ， 十 分 方便 。 对 于 函数 ， 简 
而 言 之 就 是 可 以 完成 某 项 工作 的 代码 块 ， 类 似 积木 块 ， 可 以 反复 使 用 。 


二 ”重点 导读 


“了 解 函数 的 基本 定义 。 
“掌握 函数 的 基本 使 用 。 

“掌握 函数 的 参数 传递 与 变量 作用 域 使 用 。 
“熟悉 函数 递归 。 

“掌握 函数 模块 的 使 用 。 


7.1 ”函数 的 基本 使 用 


函数 是 组 织 好 的 ， 可 重复 使 用 的 ， 用 来 实现 单一 或 相关 联 功能 的 代码 段 。 函 数 能 提高 应 用 的 模块 性 和 
代码 的 重复 利用 率 。Python 提供 了 许多 内 建 函数 ， 例 如 print0， 但 也 可 以 自己 创建 函数 ， 称 为 用 户 自 定义 
函数 。 

回 


7.1.1 函数 的 定义 与 使 用 


函数 定义 : 

(1) 函数 代码 块 以 def 关键 词 开头 ， 后 接 函 数 标 识 符 名 称 和 圆 括 号 0。 

(2) 任何 传 入 参数 和 自 变量 必须 放 在 圆 括 号 中 间 。 圆 括号 之 间 可 以 用 于 定义 参数 。 
(3) 函数 的 第 一 行 语 句 可 以 选择 性 地 使 用 文档 字符 串 一 一 用 于 存放 函数 说 明 。 
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(4) 函数 内 容 以 冒号 起 始 ， 并 且 缩 进 。 

(5) Retum[expression] 结 束 函 数 ， 选 择 性 地 返回 一 个 值 给 调用 方 。 不 带 表 达 式 的 retum 相当 于 返回 None。 

为 了 在 Python 中 创建 函数 ， 可 以 使 用 def 关键 字 ， 然 后 连接 函数 的 名 字 和 括号 : 

def name(): 

注意 这 个 语句 后 面 的 冒号 ， 现 在 ， 读 者 应 该 明白 了 还 有 很 多 代码 与 这 个 语句 相关 ， 只 需要 把 在 函数 里 
面 想 要 用 的 代码 放 在 函数 声明 下 面 ， 然 后 缩 进 ， 就 像 下 面 这 样 即 可 。 


def name () : # 定 义 函数 
Statement1 
statement2 
statement3 
statement4 


在 Python 中 ， 没 有 函数 的 结尾 式 的 分 隔 符 ， 说 明 封 装 在 函数 里 面 的 语句 完成 之 后 ， 只 需要 将 下 一 条 代 
码 语句 移 到 左边 即 可 。 
【 例 7-1】 打印 问候 语 的 函数 。 
def user(): # 定 义 函 数 
# 显 示 语 名 
print ("Hello_World") + 打印 字符 串 
以 上 语法 格式 中 , def 是 定义 函数 的 关键 字 , 它 来 告诉 Python 要 定义 一 个 函数 。 这 是 定义 函数 , 向 Python 
指出 函数 名 还 可 能 需要 指出 函数 为 完成 任务 需要 什么 样 的 信息 。 在 这 里 ，user0 是 函数 的 名 称 ， 它 不 需要 
任何 信息 就 可 以 完成 任务 ， 因 此 括号 里 面 是 空 的 ， 即 便 是 空 的 ， 这 里 的 插 号 也 是 不 能 少 的 ， 最 后 ， 定 义 以 
冒号 结尾 。 紧 跟 在 user0: 的 就 是 函数 体 了 。 
运行 以 上 代码 , 并 不 会 显示 任何 内 容 , 也 不 会 抛 出 异常 ， 因为 user0 函 数 只 是 定义 好 了 ,并 没有 被 调用 。 
要 使 用 这 个 函数 ， 就 必须 调用 它 ， 函 数 调用 可 以 让 Python 执行 函数 里 面 的 代码 ， 要 调用 函数 只 需要 函 
数 名 和 括号 里 面 的 信息 ， 由 于 这 个 函数 不 需要 任何 信息 ， 所 以 只 需要 输入 user0 就 可 以 。 
user() 


程序 运行 结果 如 图 7-1 所 示 。 


7.1.2 lambda() 函 数 


匿名 函数 lambda0) 是 指 一 类 无 须 定义 标识 符 〈 函 数 名) 的 函数 或 子 程序 。lambda0 函 数 可 以 接收 任意 多 
个 参数 包括 可 选 参 数 ) 并 且 返回 单个 表达 式 的 值 。 例 如 ， 传 入 多 个 参数 的 lambda0 函 数 : 


def sum(x,y): 
return x+y 


用 lambda 来 实现 : 

p = lambda x,y:x+y 

print (p(4,6)) 

传 入 一 个 参数 的 lambda0 函 数 : 

a=lambda x:x*x 

print (a(3)) # 注 意 : 这 里 a (3) 可 以 直接 执行 ,但 没有 输出 ,前 面 的 print 不 能 少 
多 个 参数 的 lambda 形式 : 


a = lambda x,y,z: (x+8)*y-z 
print (a(5,6,8)) 


要 点 : lambda0 函 数 不 能 包含 命令 ， 包 含 的 表达 式 不 能 超过 一 个 。 


函数 运行 结果 
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换 。 


不 一 定 非 要 使 用 lambda0 函 数 ， 任 何 能 够 使 用 它们 的 地 方 ， 都 可 以 定义 一 个 单独 的 普通 函数 来 进行 替 
作者 常 将 它们 用 在 需要 封装 特殊 的 、 非 重用 代码 上 ， 避 免 代码 中 充斥 着 大 量 单行 函数 。 


7.2 向 函数 传递 参数 


【 例 7-2】 如 果 想 要 函数 user0 不 只 是 输出 hello_world, 而 且 要 输出 用 户 的 名 字 , 那么 只 需要 在 函数 user() 


的 括号 里 面 添 加 一 个 形 参 you_name， 然 后 在 函数 调用 的 时 候 只 需要 you_name 传递 一 个 参数 给 函数 即 可 。 


def user (You_name) : 

# 显 示 语 名 

name=you_name 

print ("你 好 "+name) 

调用 函数 ， 输 入 一 个 用 户 的 名 字 “ 小 明 ”。 
user(' 小 明 ') 

程序 运行 结果 如 图 7-2 所 示 。 


[你 rr | 
图 7-2 函数 运行 结果 
无 论 输入 什么 样 的 名 字 ， 都 会 生成 对 应 的 输出 。 


返回 值 
Python 使 用 retum 语句 让 函数 以 一 个 指定 的 值 退出 。 在 使 用 了 return 语句 后 ， 可 以 指定 函数 在 完成 以 


后 返回 给 主 程序 的 值 ， 然 后 它 使 用 这 个 值 返回 到 主 程序 中 。 
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return 语句 必须 是 函数 定义 的 最 后 一 条 语句 ， 如 下 所 示 。 
def name () : 
statement1 
statement2 
return value 
【 例 7-3】 在 主 程序 中 ， 可 以 将 这 个 返回 值 分 配给 一 个 变量 ， 然 后 在 代码 中 使 用 这 个 变量 。 
# 定 义 函 数 funcl () 
def funcl() : 
a = int(input(" 输 入 一 个 值 : ') ) 
es 和 2 
return result # 返 回 值 result 
# 调 用 函数 funcl () 
x = funcl() 
Print (' 输 出 是 '，x) 


程序 运行 结果 如 图 7-3 所 示 。 


7-3 ”函数 运行 结果 
在 这 个 例子 中 函数 返回 了 一 个 整数 值 ， 但 是 也 可 以 返回 字符 串 ， 浮 点 数 ， 甚 至 是 其 他 的 Python 对 象 。 
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7.2.2” 实 参与 形 参 


在 调用 函数 时 ， 大 多 数 情况 下 ， 主 调 函 数 和 被 调 函 数 之 间 有 数据 传递 关系 ， 这 就 是 有 参数 的 函数 形式 。 
函数 参数 的 作用 是 传递 数据 给 函数 使 用 ， 函 数 利用 接收 的 数据 进行 具体 的 操作 处 理 。 函 数 定义 的 时 候 可 能 
包含 多 个 参数 。 

在 使 用 函数 时 ， 经 常会 用 到 形式 参数 和 实际 参数 ， 虽 然 两 者 都 叫 作 参数 ， 但 是 它们 还 是 有 很 大 区 别 。 
例如 形式 参数 是 在 定义 函数 时 ， 函 数 名 后 面 括号 里 的 参数 ， 实 际 参 数 就 是 在 调用 一 个 函数 时 ， 函 数 名 后 面 
括号 里 的 参数 ， 也 就 是 将 函数 的 调用 者 提供 给 函数 的 参数 称 为 实际 参数 。 

在 例 7-2 中 ， 函 数 user(you_name) 中 ， 要 求 给 you_name 一 个 值 ， 然 后 再 输出 ， 欢 迎 语句 加 上 用 户 输入 
的 值 ， 其 中 ， 变 量 you_name 就 是 一 个 形 参 ， 代 表 函 数 要 完成 它 所 需 的 一 条 信息 ， 而 在 调用 函数 user( 小 明 ) 
时 ， 值 小 明 就 是 一 个 实 参 ， 实 参 是 调用 函数 时 传递 给 函数 的 信息 ， 当 需要 调用 函数 时 ， 应 当 把 函数 需要 使 
用 的 信息 放 在 括号 里 面 ， 在 user( 小 明 ) 里 面 将 实 参 ' 小 明 ' 传 给 了 函数 user0， 而 ' 小 明 ' 这 个 值 被 放 在 了 形 参 


you_name 中 。 


7.2.3 位置 实 参 


在 调用 函数 时 ，Python 必须 将 函数 调用 中 的 每 个 实 参 都 关联 到 函数 定义 中 的 一 个 形 参 。 因 此 最 简单 的 
关联 方式 就 是 基于 实 参 的 顺序 ， 这 种 关联 方式 被 称 为 位 置 实 参 。 
【 例 7-4】 下 面 定义 一 个 显示 学 生 信息 的 函数 。 该 函数 指出 一 个 学 生 的 姓名 、 性 别 、 年 龄 、 学 校 。 代 码 
如 下 。 
+# 定 义 函 数 
def student (name, sex,age,school): 
# 输 出 学 生 基 本 信息 
print (' 该 学 生 的 姓名 是 ; '+name) 
print (' 该 学 生 的 性 别 是 ; '+sex) 
print (' 访 学生 的 年 龄 是 ; '+str (age)) 
print (' 访 学 生 的 学 校 是 : '+school) 


+ 调用 函数 
student (' 小 明 ',' 男 ', 18,' 清 华 大 学 ') 
student(name,sex,age,school) 函 数 形 参 说 明 它 需要 按 顺 序 提 供 一 个 学 生 的 姓名 、 性 别 、 年 龄 、 学 校 。 例 
如 ， 在 前 面 的 函数 调用 中 ， 实 参 ' 小 明 ' 存 储 在 形 参 name 中 ， 实 参 ' 男 ' 存 储 在 形 参 sex 中 ， 实 参 '18' 存 储 在 形 参 
age 中 ， 实 参 ' 清 华 大 学 ' 存 储 在 形 参 school 中 。 


程序 运行 结 果 如 图 7-4 所 示 。 


上 7-4 函数 运行 结果 


如 果 不 按 这 个 参数 的 顺序 传递 就 会 出 现 问题 。 
【 例 7-5】 将 该 学 生 的 姓名 与 性 别 互 换 一 下 位 置 ， 就 会 出 现下 面 这 种 结果 。 
# 定 义 函数 


def student (name, sex,age,school): 


# 输 出 学 生 基本 信息 
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Print (' 该 学 生 的 姓名 是 : '+name) 
Print (' 该 学 生 的 性 别 是 : '+sex) 
print (' 该 学 生 的 年 龄 是 : '+str (age)) 
print (' 该 学 生 的 学 校 是 : '+school) 


# 调 用 函数 
student (' 男 ', ' 小 明 ', 18,' 清 华 大 学 ') 


程序 运行 结果 如 图 7-5 所 示 。 
如 果 没 有 提供 任何 参数 或 者 提供 了 错误 数量 的 参数 ， 就 会 从 Python 生 的 学 


中 得 到 一 个 错误 信息 ， 如 下 例 所 示 。 图 7-5 函数 运行 结果 


【 例 7-6】 从 Python 中 得 到 一 个 错误 信息 。 
站 定义 函数 

def student (name, sex,age,school): 

# 输 出 学 生 基本 信息 


print (" 该 学 生 的 姓名 是 : '+name) 
print(" 该 学 生 的 性 别 是 : '+sex) 
print (" 该 学 生 的 年 龄 是 : '+str (age) ) 
print (' 该 学 生 的 学 校 是 : '+school) 
# 错 误 地 调用 函数 ,传递 错误 数量 的 实 参 。 
student (' 小 明 ') 


其 结果 Python 就 会 报错 。 
所 以 将 参数 传递 给 Python 时 需要 小 心 ，Python 以 定义 的 函数 参数 的 顺序 来 匹配 参数 值 ， 这 就 叫 作 位 置 


7.2.4 ”关键 字 实 参 


关键 字 实 参 是 指使 用 形式 参数 的 名 字 来 确定 输入 的 参数 值 ， 调 用 函数 时 传递 给 函数 的 是 名 称 - 值 对 ， 这 
样 通过 该 方式 指定 实际 参数 时 ， 不 再 需要 与 形式 参数 的 位 置 完全 一 致 ， 只 要 确保 写 入 的 形式 参数 正确 即 可 。 
这 样 就 可 以 避免 用 户 需要 牢记 参数 位 置 的 麻烦 ， 无 须 考虑 函数 调用 中 的 实际 参数 的 顺序 ， 不 仅 可 以 使 得 函 
数 的 调用 和 参数 的 传递 更 加 灵活 方便 ， 而 且 还 清楚 地 指出 了 函数 调用 中 各 个 值 的 用 途 。 

【 例 7-7】 调 用 student0 函 数 ， 参 数 传递 时 分 别 使 用 位 置 实 参 与 关键 字 实 参 来 调用 该 函数 。 

二 定义 函数 

def student (name, sex,age, School) : 

+ 输出 学 生 基 本 信息 

print (' 该 学 生 的 姓名 是 : '+name) 
print (' 该 学 生 的 性 别 是 ; '+sex) 
print (" 该 学 生 的 年 龄 是 : '+str (age)) 
print (" 该 学 生 的 学 校 是 : '+school) 


+ 使 用 位 置 实 参 调用 该 函数 
student (' 小 明 ',' 男 ' ,18,' 清 华 大 学 ') 
# 分 隔 符 
print(' 


4 使 用 位 置 实 参 调 用 该 画 数 - 
student (sex=' 男 ', name=' 小 明 ',age=18, school=' 清 华 大 学 ') J 
程序 运行 结果 如 图 7-6 所 示 。 l 

由 上 面 的 结果 可 知 ， 使 用 关键 字 实 参 传递 实 参 ， 其 参数 传递 的 结果 会 图 7-6 ”函数 运行 结果 
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传递 到 函数 其 所 对 应 的 形 参 中 ， 所 以 两 个 函数 调用 结果 是 一 样 的 。 
7.2.5 默认 值 


在 编写 函数 时 ， 可 给 每 个 形 参 指定 默认 值 。 这 样 可 以 防止 调用 函数 时 ， 如 果 没 有 给 某 个 形 参 传 入 实 参 ， 
Python 将 使 用 指定 的 默认 值 ， 默 认 参 数 为 程序 人 员 提供 了 极 大 的 便利 ， 特 别 对 于 初次 接触 该 函数 的 人 来 说 
更 是 意义 重大 ， 默 认 参 数 为 设置 函数 的 参数 提供 了 参考 。 

例如 在 上 面 的 例子 中 ，student0 函 数 指出 一 个 学 生 的 姓名 、 性 别 、 年 龄 、 学 校 。 如 果 所 有 的 学 生 是 同一 
学 校 ， 也 就 是 说 ，school 是 一 样 的 ， 假 设 都 是 清华 大 学 ， 如 果 在 输入 多 个 学 生 的 信息 时 ， 编 程 人 员 每 次 都 
需要 输入 学 生 的 学 校 信息 ， 无 疑 极 大 地 拖 慢 了 程序 的 开发 速度 。 

【 例 7-8】 形 参 自动 调用 默认 人 参数。 

站 定义 函数 

def student (name, sex,age, school=' 清 华 大 学 '): 

# 输 出 学 生 基 本 信息 

print (" 该 学 生 的 姓名 是 : '+name) 
print (" 该 学 生 的 性 别 是 : '+sex) 
print (" 该 学 生 的 年 龄 是 : '+str (age)) 
print (' 该 学 生 的 学 校 是 : '+school) 
+ 使 用 默认 值 调用 该 函数 
student (' 李 华 ', ' 女 ',18) 
程序 运行 结果 如 图 7-7 所 示 。 Fe 
7-7 

我 们 在 调用 函数 的 时 候 没有 传递 参数 给 形 参 school， 此 时 ， 形 参 。 时 ”本数 运行 结果 
school 自动 调用 默认 参数 “清华 大 学 ” 所 以 在 输出 的 时 候 会 出 现 该 学 生 的 学 校 是 清华 大 学 。 

【 例 7-9】 假 设 有 一 名 学 生 不 是 清华 大 学 的 ， 而 是 北京 大 学 的 ， 那 么 只 需要 将 其 对 应 的 形 参 传 值 。 

站 定义 函数 

def student (name, sex,age, school=' 清 华 大 学 ') : 

+ 输出 学 生 基 本 信息 

print (' 该 学 生 的 姓名 是 : '+name) 
Print (" 该 学 生 的 性 别 是 : '+sex) 
Print (' 该 学 生 的 年 龄 是 : '+str (age) ) 


print (' 该 学 生 的 学 校 是 : '+school) 
# 使 用 默认 值 调用 该 函数 
student (' 小 花 ', ' 女 ',18, ' 北 京 大 学 ') 图 7-8 ”函数 运行 结果 
程序 运行 结果 如 图 7-8 所 示 。 
仔细 观察 就 会 发 现 ， 该 学 生 的 学 校 信息 不 是 默认 值 “ 清 华 大 学 ”了 ， 而 是 “北京 大 学 ” 这 是 因为 ， 函 
数 在 被 调用 的 时 候 ， 发 现 其 向 形 参 school 传递 了 一 个 值 ， 它 就 会 优先 使 用 ， 函 数 被 调用 的 时 候 新 传 入 的 值 
是 “北京 大 学 ”。 


7.2.6 多 种 函数 调用 方式 


通过 以 上 的 学 习 ， 调 用 函数 就 可 以 混合 使 用 位 置 实 参 、 关 键 字 实 参 和 默认 值 ， 这 样 通常 就 会 有 多 种 等 
效 的 函数 调用 方式 。 

【 例 7-10】 为 一 个 形 参 设置 默认 值 。 

## 定 义 函数 

def student (name sex,age, school=' 清 华 大 学 '): 
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# 输 出 学 生 基本 信息 
Print (' 该 学 生 的 姓名 是 : '+name) 
print (' 该 学 生 的 性 别 是 : '+sex) 
print (' 该 学 生 的 年 龄 是 : '+str (age)) 
print (' 该 学 生 的 学 校 是 : '+school) 


基于 以 上 这 种 函数 定义 , 在 任何 情况 下 都 必 


须 给 student0 函 数 提供 表示 学 生 姓名 的 name 实 参 , 性 别 sex 


的 实 参 ,年龄 age 的 实 参 ， 指 定 该 实 参 时 可 以 使 用 位 置 方式 ， 还 可 以 使 用 关键 字 方式 。 如 果 要 描述 的 学 生 


的 学 校 不 是 “清华 大 学 ” 那么 还 必须 在 函数 调用 中 给 形 参 school 提供 实 参 ; 同样 指定 该 实 参 时 可 以 使 用 位 


置 方式 ， 还 可 以 使 用 关键 字 方 式 。 
下 面 是 对 该 函数 的 等 效 调用 ， 代 码 如 下 。 
# 接 上 面 代码 
# 使 用 默认 值 参数 
student (' 张 三 ', ' 男 ', 22) 
Drint( > 
+ 使 用 位 置 实 参 并 不 使 用 其 所 给 的 默认 什 
student (' 张 三 ', ' 男 ', 22, ' 北 京 大 学 ') 
Brint ("= 
# 使 用 关键 字 实 参 


student (sex=' 男 ', name=' 张 三 ', age=22, school=' 清 华 大 学 ') 


程序 运行 结果 如 图 7-9 所 示 。 


需要 注意 的 是 无 论 使 用 哪 种 调用 方式 都 是 无 关 紧 要 的 ， 只 


要 函数 调用 能 生成 希望 的 输出 就 行 。 使 用 最 容易 理解 的 调用 广 FE 


式 即 可 。 


7.3 在 函数 中 处 理 变 量 


在 Python 函数 中 可 以 使 用 两 种 不 同类 型 的 变量 ， 一 种 是 局 部 变量 ， 另 一 种 是 全 局 变量 。 这 两 种 变量 在 


代码 中 的 作用 有 些 不 同 ， 因 此 知道 它们 是 如 何 了 
全 局 变量 的 区 别 ， 以 及 它们 的 使 用 方法 。 


.3.1 局 部 变量 


[ 作 的 是 很 重要 的 。 下 面 会 讲解 在 Python 代码 中 局 部 变量 与 


局 部 变量 是 在 函数 内 部 创建 的 变量 ， 因 为 是 在 函数 内 部 创建 这 些 变量 的 ， 因 此 只 能 在 函数 内 部 访问 它 


们 ， 在 函数 的 外 部 ， 其 他 代码 并 不 识别 这 些 变量 ， 如 例 7-11 所 示 。 


【 例 7-11】 局 部 变量 。 

## 定 义 函 数 

def areas (width,height) : 
area=width*height 
print ("在 函数 内 部 , 宽 的 值 是 : ", width) 
print ("在 函数 内 部 ,高 的 值 是 : ", height) 


return area 
# 调 用 函数 


mianji=areas (10, 20) 


Print (' 在 函数 外 部 , 宽 的 值 是 : ' ,width) 
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print (" 在 函数 外 部 ,高 的 值 是 : ', height) 

print (' 面 积 是 : ' ,mianji) 

上 面 的 程序 运行 的 时 候 会 出 现 错误 ， 这 段 代码 前 面 是 很 好 的 ， 传 递 两 个 参数 给 函数 areas0， 然 后 它们 
毫 无 问题 地 完成 了 ， 但 是 ， 当 代码 尝试 在 areas0 外 部 访问 变量 width 时 ，Python 就 会 产生 错误 信息 ， 指 出 
变量 width 没有 定义 。 


7.3.2 全 局 变量 


全 局 变量 是 可 以 在 程序 的 任何 地 方 都 可 以 访问 的 变量 ， 包 括 在 函数 内 部 ， 在 主 程序 中 分 配给 全 局 变量 
的 值 在 函数 代码 中 是 可 以 访问 的 ， 但 是 有 一 个 问题 : 函数 可 以 读 取 全 局 变量 ， 同 时 在 默认 情况 下 ， 它 不 能 
改变 它们 。 

【 例 7-12】 全 局 变量 1。 

width=10 

height=20 

area=0 

# 定 义 函 数 

def areas() : 

area=width*height 
print (' 在 函数 内 , area 的 值 是 : ', area) 

# 调 用 函数 

areas () 

print (' 在 函数 外 ，area 的 值 是 : ', area) 

程序 运行 结果 如 图 7-10 所 示 。 

所 以 当 在 主 程序 中 读 取 变 量 area 的 值 时 ， 它 的 值 还 是 原来 设置 的 全 局 变量 的 值 ， 而 不 是 在 函数 areas0 
里 面 改 变 了 的 值 。 

有 一 个 方法 可 以 解决 这 个 问题 。 要 告诉 Python 这 个 函数 要 尝试 访问 一 个 全 局 变量 , 需要 添加 一 个 global 
关键 字 来 定义 这 个 变量 ， 在 函数 内 部 叫 作 area 的 变量 与 主 函 数 中 叫 作 area 的 变量 视 为 等 同 。 

【 例 7-13】 全 局 变量 2。 

width=10 


height=20 

area=0 

站 定义 函数 

def areas(): 

+# 使 用 global 关键 字 

global area 
area=width*height 
print (' 在 函数 内 , area 的 值 是 : ', area) 


图 7-10 函数 运行 结果 


# 调 用 函数 rea 的 值 是 : 268 
areas () area 269 
Print (' 在 函数 外 ，area 的 值 是 : ', area) 7-11 函数 运行 结果 


程序 运行 结果 如 图 7-11 所 示 。 


7.4 递归 函数 


我 们 都 知道 ， 一 个 函数 可 以 调用 其 他 函数 ， 如 果 这 个 函数 在 内 部 调用 它 自己 ， 那 么 这 个 函数 就 叫 作 递 
归 函 数 。 实 际 上 ， 递 归 是 函数 实现 的 一 个 很 重要 的 环节 ， 很 多 程序 中 或 多 或 少 地 使 用 到 了 递归 函数 。 而 递 
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归 的 意思 就 是 函数 自己 调用 自己 本 身 ， 或 者 是 在 自己 函数 调用 的 下 级 函数 中 调用 自己 。 

递归 之 所 以 能 实现 ， 是 因为 函数 的 每 个 执行 过 程 都 在 栈 中 有 自己 的 形 参 和 局 部 变量 的 拷贝 ， 而 这 些 撕 
贝 和 函数 的 其 他 执行 过 程 互 不 影响 。 这 种 机 制 是 当代 大 多 数 程序 设计 语言 实现 子 程序 结构 的 基础 ， 使 得 递 
归 成 为 可 能 。 假 定 某 个 调用 函数 调用 了 一 个 被 调用 函数 ， 再 假定 被 调用 函数 又 反 过 来 调用 了 调用 函数 。 这 
第 二 个 调用 就 被 称 为 调用 函数 的 递归 ， 因 为 它 发 生 在 调用 函数 的 当前 执行 过 程 运行 完毕 之 前 。 而 且 ， 因 为 
这 个 原先 的 调用 函数 、 现 在 的 被 调用 函数 在 栈 中 较 低 的 位 置 有 它 独立 的 一 组 参数 和 自 变量 ， 原 先 的 参数 和 
变量 将 不 受 影响 ， 所 以 递归 能 正常 工作 。 

阶乘 的 算法 是 一 个 经 典 的 递归 例子 ， 一 个 数 的 阶乘 是 所 有 小 于 或 等 于 它 本 身 的 正 整数 的 一 个 乘积 ， 例 
如 ，5 的 阶乘 是 120， 如 下 所 示 。 

5!=1*2*3*4*5=120 

按照 定义 ，0 的 阶乘 是 1， 要 找 出 5 的 阶乘 ， 必 须 用 5 乘 以 4 的 阶乘 ， 要 找 出 4 的 阶乘 ， 需 要 用 4 乘 以 
3 的 阶乘 ， 一 直 算 下 去 ， 直 到 1 乘 以 0 的 阶乘 ， 这 是 一 个 完美 的 递归 例子 。 

要 使 用 递归 创建 一 个 阶乘 函数 ， 需 要 定义 一 个 终点 防止 程序 一 直 卡 在 循环 中 ， 对 于 阶乘 来 说 ， 终 点 是 
0 的 阶乘 : 


if (num ==0) : 
return 0 


【 例 7-14】 创 建 阶乘 函数 。 
## 定 义 函数 


def factorial (num) : 
if ( nim == 0)5 
return 1 
else: 
return num*+factorial (num-1) 
+ 调用 函数 
result = factorial(5) 
print ("5 的 阶乘 是 ', result) 


程序 运行 结果 如 图 7-12 所 示 。 


图 7-12 函数 运行 结果 
函数 factorial0 首 先 检查 参数 是 否 为 0。 如 果 是 ， 则 返回 默认 的 定义 1。 如 果 参 数 不 是 0， 它 会 执行 一 个 
新 的 运算 ， 返 回 这 个 值 乘 以 比 这 个 值 小 1 的 阶乘 。 因 此 函数 factorial0 调 用 它 自己 ， 每 一 次 使 用 一 个 更 小 的 
数字 ， 直 到 0 为 止 。 


7.5 ”函数 模块 化 


了 Python 模块 可 以 在 逻辑 上 组 织 Python 程序 , 将 相关 的 程序 组 织 到 一 个 模块 中 , 使 程序 具有 良好 的 结构 ， 
增加 程序 的 重用 性 。 模块 可 以 被 别 的 程序 导入 , 以 调用 该 模块 中 的 函数 , 这 也 是 Python 标准 库 模 块 的 方法 。 
回 


-5.1 模块 的 导入 
要 让 函数 是 可 导 的 ， 需 要 先 创建 模块 。 模 块 是 扩展 名 为 .py 的 文件 ， 包 含 要 导入 程序 中 的 代码 。 
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用 户 自 定义 一 个 模块 就 是 建立 一 个 Python 程序 文件 ， 其 中 包括 变量 、 函 数 的 定义 。 下 面 是 一 个 简单 的 
模块 ， 程 序 文件 名 是 Chap7.15.py。 

【 例 7-15】 创 建 一 个 程序 。 

# 定 义 函数 


def Print_fun (name) : 
print (' 你 好 :', name) 


下 面 再 创建 一 个 程序 ， 程 序 文件 名 是 Chap7.16.py， 代 码 如 下 。 
【 例 7-16】 再 创建 一 个 程序 。 


# 导 入 模块 Chap7.15 

import Chap7.15 

# 使 用 模块 support 中 的 函数 print_fun () 
Chap7.15.print_fun ("小 明 ") 


程序 运行 结果 如 图 7-13 所 示 。 


| 你 好 : 小 明 | 
7-13 ”函数 运行 结果 
从 上 面 可 以 看 出 ， 导 入 模块 的 一 种 方法 是 : 编写 一 条 import 语句 并 在 其 中 指定 模块 名 ， 就 可 以 使 用 模 
块 中 的 所 有 函数 了 。 使 用 模块 内 函数 语法 为 : module_name.function_name()。 


7.5.2 导入 特定 函数 


如 果 一 个 模块 里 面 有 多 个 函数 ， 但 是 只 需要 使 用 其 中 的 一 个 或 几 个 函数 ， 其 他 的 函数 不 想 导入 ， 那 么 
可 以 选择 导入 特定 的 函数 。 

这 种 导入 方法 的 语法 如 下 : 

from module name import function name 

通过 使 用 逗号 分 隔 函 数 名 ， 可 根据 需要 从 模块 中 导入 任意 数量 的 函数 。 

from module name import function 0,function 1,function 2e 

【 例 7-17】 对 于 前 面 的 Chap7.16.py 实例 ， 如 果 只 想 导入 要 使 用 的 函数 ， 代 码 类 似 于 下 面 这 样 。 


# 导 入 模块 里 面 指定 的 函数 

from Chap7.15 import print _ fun 
# 调 用 函数 

Print_fun(" 小 明 ") 


若 使 用 这 种 语法 ， 调 用 函数 时 就 可 以 不 使 用 句点 ， 只 需 指定 要 调用 的 函数 名 称 即 可 。 


7.5.3 函数 别名 


如 果 要 导入 的 函数 的 名 称 可 能 与 程序 中 现 有 的 名 称 冲突 ， 或 者 函数 的 名 称 太 长 ， 这 时 就 可 以 为 该 函数 
起 一 个 独一无二 的 别名 ， 类 似 人 的 外 号 ， 主 要 是 在 import 语句 中 使 用 关键 字 as 将 函数 重 命名 为 别名 。 

指定 别名 的 通用 语法 如 下 : 

from module name import function name as fn 

【 例 7-18】 给 函数 指定 别名 。 


上 # 导 入 模块 里 面 指定 的 函数 并 用 as 指定 别名 为 a 
from Chap7.15 import print fun as a 


[oslo] 
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# 调 用 函数 

a(" 小 明 ") 

当然 ， 还 可 以 给 模块 指定 别名 。 通 过 给 模块 指定 简短 的 别名 ， 可 以 在 调用 该 模块 中 的 函数 时 更 轻松 , 
使 代码 更 简洁 ， 还 可 以 让 我 们 不 再 关注 模块 名 ， 而 专注 于 描述 性 的 函数 名 。 

给 模块 指定 别名 的 通用 语法 如 下 : 

import module name as mn 

【 例 7-19】 给 模块 指定 别名 。 


# 导 入 模块 并 用 as 指定 别名 为 b 

import Chap7.15 as b 

# 使 用 模块 support 中 的 函数 print_fun () 
b.print_fun(" 小 明 ") 


7.6 ”内置 函数 


一 般 来 说 ， 在 Python 中 内 置 了 很 多 有 用 的 函数 ， 可 以 直接 调用 。 而 要 调用 一 个 函数 ， 就 需要 知道 函数 
的 名 称 和 参数 ， 例 如 求 绝 对 值 的 函数 abs， 只 有 一 个 参数 。 调 用 abs 函数 : 

人 

abs(10.12) 

调用 函数 的 时 候 ， 如 果 传 入 的 参数 数量 不 对 ， 会 报错 ， 并 且 Python 会 明确 地 提示 : abs0 有 且 仅 有 1 个 
参数 。 如 果 传 入 的 参数 数量 是 对 的 ， 但 参数 类 型 不 能 被 函数 所 接受 ， 也 会 报错 ， 并 且 给 出 错误 信息 。 

而 比较 函数 cmp(x,y) 就 需要 两 个 参数 ， 如 果 x<y， 返 回 -1; 如 果 x==y， 返 回 0; 如 果 x>y， 返 回 1。 

cmp (1,2) 

cmp (2,2) 

cmp(2,1) 

Python 内 置 的 常用 函数 还 包括 数据 类 型 转换 函数 ， 例 如 ，int0 函 数 可 以 把 其 他 数据 类 型 转换 为 整数 。 

int ('123') 

int (12.34) 

float ('12.34') 

str(1.23) 

unicode (100) 

bool (1) 

bool1('') 

调用 Python 的 函数 ， 需 要 根据 函数 定义 ， 传 入 正确 的 参数 。 如 果 函 数 调用 出 错 ， 一 定 要 学 会 看 错误 信 

息 。 主 要 的 内 置 函 数 如 下 所 示 。 


abs0 divmod0 inputO open0 staticmethodO 
all0 enumerate() intO ord0 str0 

any0 eval(O isinstance() powO sumO 
basestringO execfile0 issubclass(|) printO super0 

bin0 fae0 iter0 Property0 tuple0 

bool0 fnter0 len0 range0 type0 
bytearray() float0 listO Taw_input() unichr0 
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callable0 fomatO locals0 reduce0 unicode0 
chr0 frozensetO long0 Teload0 vars() 
classmethodO getattr0) mapO) TeprO xrange() 

cmpO globals| maxO Teverse0 zip0 

compileO hasattr0 memoryview0 ToundO —import 0 
complexO hashO min0 setO 

delattrO help0 nextO) setattr0 

dict0 hex0 object0 slice0 

dir0 id0 oct0 sorted0 exec 内 置 表达 式 


7.7 ”就 业 面 试 技巧 与 解析 


通过 本 章 对 函数 的 学 习 ， 相 信 读 者 也 掌握 了 本 章 的 内 容 ， 那 么 究竟 掌握 得 如 何 呢 ? 下 面 通过 两 个 面试 
习题 来 测试 一 下 吧 。 


7.7.1 面试 技巧 与 解析 (一 ) 


面试 官 : 如 果 一 个 全 局 变量 ， 在 函数 里 面 被 调用 被 改变 了 ， 那 么 ， 在 函数 外 面 再 调用 该 全 局 变量 是 否 
是 改变 后 的 值 ? 如 果 不 是 ， 怎 样 使 其 变 为 在 函数 内 部 改变 后 的 值 ? 

应 聘 者 : 再 次 调用 时 ， 该 全 局 变量 的 值 没有 发 生 改 变 ， 要 使 该 全 局 变量 改变 为 在 函数 内 部 改变 过 的 值 ， 
需要 使 用 关键 字 global， 要 告诉 Python 函数 正在 尝试 访问 一 个 全 局 变量 ， 添 加 一 个 global 关键 字 来 定义 这 
个 变量 ， 在 函数 内 部 该 变量 与 主 函数 中 的 全 局 变量 视 为 等 同 。 这 样 就 可 以 使 该 全 局 变量 改变 为 在 函数 内 部 
改变 过 的 值 。 


7.7.2 ”面试 技巧 与 解析 (二) 


面试 官 : 函数 模块 是 什么 ? 使 用 函数 模块 有 什么 好 处 ? 

应 聘 者 : 函数 模块 是 把 一 些 功能 函数 相关 的 代码 写 到 一 个 模块 里 。 当 需要 用 到 某 个 功能 时 ， 将 这 个 模 
块 导入 ， 就 可 以 直接 使 用 它 的 函数 了 ， 在 Python 中 ， 一 个 模块 就 是 一 个 py 文件 ， 可 以 说 一 个 文件 就 是 一 
个 独立 的 模块 ， 使 用 函数 模块 使 代码 的 可 复 用 性 增强 ， 代 码 更 加 简洁 、 高 效 。 
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第 8 章 
文件 与 文件 目录 


二 ”学 习 指引 


在 前 面 的 章节 中 使 用 变量 、 对 象 以 及 序列 的 数据 是 驻 留 在 计算 机 内 存 中 。 这 些 数据 在 程序 运行 时 才 会 
存在 ， 程 序 结束 就 会 消失 ， 这 样 很 不 利于 高 效 方便 地 使 用 数据 。 为 了 解决 这 个 问题 ， 需 要 借助 于 评判 硬盘 
内 数据 的 存储 情况 。 在 本 章 中 将 学 习 文件 操作 和 目录 操作 等 相关 知识 。 


二 重点 导读 
* 文件 的 打开 和 关闭 。 


“文件 和 目录 操作 模块 。 
"编译 可 执行 文件 。 


8.1 文件 的 基础 操作 


Python 内 置 了 读 写 文件 的 函数 ， 用 法 和 C 是 兼容 的 。 本 节 的 介绍 内 容 大 致 有 : 文件 的 打开 、 文 件 对 象 、 
文件 的 读 写 等 。 
加 


8.1.1 文件 打开 /关闭 
打开 文件 open0 函 数 的 语法 如 下 : 


File Object = open(file name[,access mode] [,buffering]) 


参数 详解 如 表 8-1 所 示 。 


表 8-1 open() 函 数 参 数 详解 


参 数 说 明 
File Object 被 创建 的 file 对 象 
file_name 强制 参数 ， 以 字符 串 的 形式 存储 要 被 访问 的 文件 的 名 称 
access_mode 可 选 参数 ， 访 问 文件 的 模式 


buffering 可 选 参数 ， 设 置 文件 访问 时 的 寄存 区 的 缓冲 大 小 


第 图章 文件 与 文件 目录 


【 例 8-1】 打 开 文件 。 
file=open ("E: /新 建文 件 夹 \Text .txt", 'r') 
第 二 个 参数 是 访问 模式 。 
其 中 ， 文 件 访问 模式 的 参数 如 表 8-2 所 示 。 
表 8-2 文件 访问 模式 
描 述 
r 以 只 读 方式 打开 文件 。 文 件 的 指针 将 会 放 在 文件 的 开头 。 这 是 默认 模式 
四 以 二 进 制 格式 打开 一 个 文件 用 于 只 读 。 文 件 指针 将 会 放 在 文件 的 开头 
于 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 
Tb+ 以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 
Ww 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 则 将 其 覆盖 。 如 果 该 文件 不 存在 ， 创 建新 文件 
wb 以 二 进 制 格式 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 则 将 其 覆盖 。 如 果 该 文件 不 存在 ， 创 建新 文件 
w+ 
wbt+ 


打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 则 将 其 覆盖 。 如 果 该 文件 不 存在 ， 创 建新 文件 
以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 则 将 其 覆盖 。 如 果 该 文件 不 存在 ， 创 建新 文件 
打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 也 就 是 说 ， 新 的 内 容 将 会 被 
加 写 入 到 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 创 建新 文件 进行 写 入 
以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 也 就 是 说 ， 新 
由 的 内 容 将 会 被 写 入 到 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 创 建新 文件 进行 写 入 
打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 文 件 打 开 时 会 是 追加 模式 。 
如 果 该 文件 不 存在 ， 创 建新 文件 用 于 读 写 


细 以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 如 果 该 文件 不 
世 存在 ， 创 建新 文件 用 于 读 写 


文件 在 结束 使 用 时 ， 应 尽量 使 用 close0 函 数 关 闭 ， 这 是 一 个 好 的 习惯 。 


8.1.2 文件 的 读 取 


由 于 文件 读 写 时 都 可 能 产生 IOError， 为 了 保证 无 论 是 否 出 错 都 能 正确 地 关闭 文件 ， 可 以 用 ty…finally 
来 实现 。 

【 例 8-2】 文件 读 取 。 
try: 

file = open("E:\ 新 建文 件 夹 \Text.txt", 'r') 

print (file.read()) 
finally: 

file.close() 


程序 运行 结果 如 图 8-1 所 示 。 

E:\ 新 建文 件 夹 \Texttxt 文件 内 容 如 图 8-2 所 示 。 

read0) 函 数 会 一 次 性 读 取 文 件 的 全 部 内 容 ， 如 果 能 确保 文件 的 大 小 ， 自 然 可 以 。 但 若 文件 过 大 ， 就 会 占 
用 大 量 的 内 存 ， 所 以 可 以 反复 调用 read(size) 方 法 ， 每 次 最 多 读 取 size 个 字 节 的 内 容 。 
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司 Text bt - 记过 本 
文 忻 (R) 丝 重 (日 福 式 (DO) 查看 V) 帮助 (H) 
IThis a Python programl 


Helo world! 


图 8-1 使 用 ty finally 打开 关闭 文件 ”图 8-2 Texttt 文 件 内 容 
【 例 8-3】read0 方 法 读 取 文件 。 


content = "" 
try: 
file = open("E:\ 新 建文 件 夹 \Text.txt", 'r') 
while True: 
chunk = file.read(5) 
print (chunk) 
if not chunk: 
break 
content += chunk 
finally: 
file.close() 
程序 运行 结果 如 图 8-3 所 示 。 
在 实例 中 设置 read0 方 法 每 次 读 取 5 字 节 , 从 运行 结果 可 以 看 出 ， 
每 次 从 文件 中 读 取 5 字 节 的 数据 , 然后 打印 出 换行 。 但 是 如 果 文 件 中 
有 中 文 时 ， 可 能 会 出 现 乱码 ， 因 为 中 文字 符 占用 两 字 节 。 
除了 read() 方 法 还 可 以 使 用 readline() 方 法 和 readlines() 方 法 进行 
读 取 。readline0 方 法 每 次 读 取 一 行 数据 ， 返回 一 个 字符 对 象 ， 占 用 的 
内 存 较 小 ， 比 较 适 合 大 文件 的 读 取 ， 但 是 反复 调用 readline0 方 法 程 
序 的 运行 时 间 会 比较 长 。 
【 例 8-4】readline0 方 法 读 取 文件 。 
try: 
file = open("E:\ 新 建文 件 夹 \Text.txt",'r') 
while True: 
chunk = file.readline() 
print (chunk) 
if not chunk: 
break 
finally: 
file.close() 
程序 运行 结果 如 图 8-4 所 示 。 
readlines0 方 法 读 取 整个 文件 所 有 行 ， 保 存在 一 个 列表 (list) 变量 中 ， 每 行 作为 一 个 元 素 ， 但 读 取 大 文 
件 时 会 比较 占 内 存 。 
【 例 8-5】readlines0 方 法 读 取 文件 。 


8-3 read() 方 法 实例 结果 
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try: 
file = open("E:\ 新 建文 件 夹 \Text.txt",'r') 
lines = file.readlines () 
print (type (lines)) 
print (lines) 
finally: 
file.close() 


程序 运行 结果 如 图 8-5 所 示 。 


图 8-4 readline() 方 法 实例 结果 图 8-5 readlines() 方 法 实例 结果 
在 本 节 中 共 介 绍 了 三 种 读 取 文件 的 方法 : read0、readline0 、readlines0， 在 实际 应 用 中 要 灵活 地 选择 ， 
进行 文件 的 读 取 。 
8.1.3 文件 的 写 入 六 
写 文件 和 读 文件 是 一 样 的 ， 唯 一 区 别 是 调用 open0 函 数 时 , 传 入 标识 符 'w' 或 者 'wb' 表 示 写 文本 文件 或 写 
二 进 制 文件 。 
【 例 8-6 文件 写 入 。 


try: sy 
file = open("E:\ 新 建文 件 夹 \Text .txt", 'w') 扣 Texttt -ia - 口 x 
file.write("Hello world!") 文件 介 编辑 (E) 格式 (90) 查看 V) 
finally: 者 BD(H) 


Hello world! 


file.close() 

程序 运行 结果 如 图 8-6 所 示 。 

除了 write0 方 法 写 入 文件 ， 还 有 writeline0 和 writelines0， 具 体 的 使 
用 方法 和 文件 读 取 相似 ， 这 里 就 不 做 介绍 了 。 需 要 注意 的 是 : 可 以 反复 图 8-6 文件 写 入 实例 结果 
调用 write0 来 写 入 文件 ， 但 是 务必 要 调用 fclose0 来 关闭 文件 。 写 文件 
时 ， 操 作 系统 往 往 不 会 立刻 把 数据 写 入 磁盘 ， 而 是 放 到 内 存 缓存 起 来 ， 空 闲 的 时 候 再 慢 慢 写 入 。 只 有 调用 
close() 方 法 时 , 操作 系统 才 保证 把 没有 写 入 的 数据 全 部 写 入 磁盘 。 忘记 调用 close0 的 后 果 是 数据 可 能 只 写 了 
一 部 分 到 磁盘 ， 剩 下 的 就 丢失 了 。 


8.1.4 用 fileinput 操作 文件 


fileinput 模块 可 以 对 一 个 或 多 个 文件 中 的 内 容 进 行 迭代 、 遍历 等 操作 。 该 模块 的 input0 函 数 有 点 儿 类 似 
文件 的 readlines( 方 法 ， 区 别 在 于 前 者 是 一 个 迭代 对 象 ， 需 要 用 for 循环 迭代 ， 后 者 是 一 次 性 读 取 所 有 行 。 
用 fileinput 对 文件 进行 循环 遍历 、 格 式 化 输出 、 查 找 、 蔡 换 等 操作 ， 非 常 方便 。 

基本 格式 : 

fileinput.input([files[,inplace[,backup[,bufsize[,mode[,openhook]]]]]]) 

默认 格式 : 

fileinput.input (files=None, inplace=False, backup='', bufsize=0, mode='r', openhook=None) 


参数 如 下 所 示 。 
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files : # 文 件 的 路 径 列表 ,默认 是 stdin 方式 ,多 文件 ['1.txt','2.txt',*…] 
inplace: ## 是 否 将 标准 输出 的 结果 写 回 文件 , 默认 不 取代 

backup: # 备 份 文件 的 扩展 名 ,只 指定 扩展 名 ,如 .bak。 如 果 该 文件 的 备份 文件 已 存在 , 则 会 自动 覆盖 
bufsize: 4 缓冲 区 大 小 ,默认 为 0, 如果 文 件 很 大 ,可 以 修改 此 参数 ,一 般 默 认 即 可 
mode: # 读 写 模式 ,默认 为 只 读 

openhook: # 用 于 控制 打开 的 所 有 文件 ， 例 如 编码 方式 等 

常用 的 方法 : 

fileinput.input () # 返 回 能 够 用 于 for 循环 遍历 的 对 象 

fileinput .filename () # 返 回 当 前 文件 的 名 称 

fileinput .lineno() # 返 回 当 前 已 经 读 取 的 行 的 数量 ( 或 者 序号 ) 
fileinput.filelineno() # 返 回 当前 读 取 的 行 的 行 号 
fileinput.isfirstline() # 检 查 当 前 行 是 否 是 文件 的 第 一 行 
fileinput.isstdin() # 判 断 最 后 一 行 是 否 从 stdin 中 读 取 
fileinput.close() +# 关 闭 队 列 


接 下 来 演示 fileinput 的 几 个 方法 ， 使 用 input 读 取 文件 内 容 。 
【 例 8-7】input 读 取 文件 。 
import fileinput 


for line in fileinput.input ('E:\ 新 建文 件 夹 \Text .txt'): 
print (line) 


程序 运行 结果 如 图 8-7 所 示 。 


o| 


以 看 出 input0 方 法 与 read0 方 法 的 效果 是 一 样 的 , input0 方 法 是 


将 又 


种 方法 读 取 文件 的 速 


在 本 节 吕 


print 
print 
print 
print 
print 


和 会 重 上 


件 的 所 有 内 容 读 取 返 回 一 个 字符 串 。 如 果 文 件 不 是 很 大 ， 采 用 这 


度 会 很 快 。 


图 8-7 input() 方 法 实例 结果 


8.2 ”常用 文件 和 目录 操作 


介绍 文件 和 目录 的 一 些 常用 操作 。 


获得 当前 路 径 
【 例 8-8】 获得 当前 文件 。 


import os 


(os 
(os 
(os 
(os 
(os 


.getcwd() ) # 获 取 当 前 工作 目录 路 径 
.path.abspath('.')) # 获 取 当 前 工作 目录 路 径 

.path.abspath ('test.txt')) # 获 取 当 前 目录 文件 下 的 工作 目录 路 径 
.path.abspath('..')) # 获 取 当 前 工作 的 父 目录 ! 注意 是 父 目录 路 径 
.path.abspath (os.curdir)) # 获 取 当 前 工作 目录 路 径 


程序 运行 结果 如 


图 8-8 所 示 。 


“8.2.2 ”获得 目录 中 的 内 容 
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【 例 8-9】 获 得 目 


import os 
for line in os.listdir('E:"): 


录 内 容 。 


8-8 ”获得 当前 路 径 的 结果 


第 贺 章 “文件 与 文件 目录 


print (line) 
上 述 实例 中 使 用 listdir0 方 法 列 出 指定 目录 下 的 文件 , 此 方法 返回 值 为 列表 , 程序 运行 结果 如 图 8-9 所 示 。 
E 盘 中 的 文件 内 容 如 图 8-10 所 示 ， 读 者 可 以 与 运行 结果 进行 对 比 。 


360WiFi 

看 CloudMusic 

看 cnupG 

看 Ksoftware 

看 ksoftwareo 
QQMusicCache 

和 

新 a 文件 夫 

看 迅 委 下 载 

Bh gpg4swin 2.2.1.exe 

史 MediacreationTool1809.exe 

图 myeclipse 2017-2.0-online-installer-.. 
nmap-7.70-setup.exe.fdmdownload 
nmap-7.70-win32.zip fdmdownload 

攻 pychorm-community-2018.3.2.exe 

高 XunLeiWebSetup101.6246dl (1).exe 

高 XunLeWebSetup10.1.6.246dl exe 
新 旨 文 丰 文 档 bd 20181 0 


图 8-9 listdir() 方 法 结果 实例 图 8-10 E 盘 文件 内 容 
除了 使 用 os.listdir0 方 法 列 出 指定 目录 下 的 文件 以 外 ， 还 可 以 使 用 glob 模块 ， 并 且 进 行文 件 内 容 过 滤 。 
在 下 面 的 实例 中 ， 依 然 以 E 盘 为 指定 的 目录 ， 只 列 出 .exe 文件 。 
【 例 8-10】 获 得 目录 .exe 文件 。 
import glob 


for line in glob.glob('E:\*.exe'): 
print (line) 


程序 运行 结果 如 图 8-11 所 示 。 

在 结果 图 中 可 以 对 比 上 一 个 实例 中 的 结果 ， 只 列 出 
了 .exe 的 文件 。glob 模块 在 指定 目录 时 ， 可 以 使 用 通配符 图 8-11 使 用 glob 列 出 E 盘 .exe 文件 结果 
“*” 和 “? ”对 文件 进行 过 滤 ， 非 常 方便 。 


8.2.3 创建 目录 


Python 中 创建 文件 夹 用 到 了 mkdir0 和 makedirs0 两 个 方法 ， 前 者 创建 一 层 目录 ， 后 者 创建 多 层 目录 ， 
下 面 来 看 看 具体 是 怎么 用 的 。Mkdir0 和 makedirs0 是 在 os 模块 中 ， 所 以 先 要 引入 os 模块 。 下 面 先 介绍 使 用 
Imkdir() 方 法 建立 一 层 目录 。 
【 例 8-11】 创建 目录 。 
EE | 此 电脑 新 加 耸 (E:) 新 建文 件 夹 
os.mkdir (\E:/ 新 建文 件 夫 / 新 建文 件 夫 由 | 
程序 运行 结果 如 图 8-12 所 示 。 
mkdir0 方 法 只 能 创建 一 层 目 录 ， 如 果 上 述 实例 中 第 一 
个 “新 建文 件 夹 ” 不 存在 ， 会 出 现 如 图 8-13 所 示 的 异常 。 


Imakedirs() 方 法 可 以 创建 多 层 目 录 ， 此 时 已 经 删除 了 E | 新 建文 件 赤 Texttbdt 中 文 :txt 
盘 下 的 “新 建文 件 夹 ”目录 。 8-12 ”使 用 mkdir() 创 建 目录 结果 


【 例 8-12】 创 建 多 层 目 录 。 
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import os 


05.makedirs ('E:/ 新 建文 件 夹 /文件 夹 ') 
程序 运行 结果 如 图 8-14 所 示 。 


号 电脑 新 加 夺 (E) 》 新 建文 件 夫 》 


文件 夹 


图 8-13 出 现 的 异常 情况 8-14 makedirs() 创 建 多 层 目录 结果 


几 8.2.4 ”删除 目录 


删除 目录 可 以 使 用 os 模块 的 rmdir0 方 法 ， 但 是 要 求 所 要 删除 的 目录 是 空 目录 ， 否 则 会 抛 出 OSError 错 
误 。 注 意 : os 模块 中 的 remove() 方 法 是 删除 文件 的 ， 如 果 调 用 该 方法 删除 一 个 目录 ， 会 抛 出 OSError 错误 。 
在 下 面 的 实例 中 ， 尝 试 使 用 rmdir0 方 法 删除 E 盘 中 的 “新 建文 件 夹 ”目录 ， 但 是 在 该 目录 下 有 刚刚 创建 的 
“文件 来” 目录 ， 看 看 是 否 会 成 功 删 除 。 

【 例 8-13】 删 除 目录 。 

import os 


path = "E:/ 新 建文 件 夹 " 


os.rmdir (path) 


程序 运行 结果 如 图 8-15 所 示 。 


图 8-15 使 用 rmdir() 删 除 目录 结果 


在 错误 提示 中 可 以 看 到 : 所 要 删除 的 目录 不 是 空 的， 无 法 删除 。 但 是 可 以 使 用 递归 的 方法 删除 一 个 目 
录 下 的 所 有 内 容 。 

【 例 8-14】 删 除 多 层 目录 。 

import os 


CUR_PATH = 'E:\ 新 建文 件 夹 ' 
def del file(path): 
1s = os5.1istdir (path) 
for i in 1s: 
c_ path = os.path.join(path, i) 
if os.path.isdir(c path): 
del filel(c path) 
else: 
os.rmdir(c path) 


del file(CUR_ PATH) 
当 8.2.5 判断 是 否 是 目录 


判断 目录 可 以 使 用 pathlib 模块 中 的 方法 来 进行 。 
【 例 8-15】 判断 是 否 是 目录 。 
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import pathlib 

path = 'E:\ 新 建文 件 夹 ' 

PATH = pathlib.Path (path) 

print (PATH.is dir()) 

程序 运行 结果 如 图 8-16 所 示 。 

除了 使 用 pathlib 模块 来 判断 目录 是 否 存 在 ， 还 可 以 使 用 
os 模块 来 判断 指定 的 目录 是 否 存在 。 ds 

【 例 8-16】 判 断 目录 是 否 存在 。 

import os 

path = 'E:\ 新 建文 件 夹 ' 


PATH = o05.path.isdir (path) 
print (PATH) 


程序 运行 结果 如 图 8-17 所 示 。 图 8-17 判断 目录 是 否 存在 结果 


8.2.6 判断 是 否 是 文件 


和 判断 目录 一 样 ， 可 以 使 用 pathlib 模块 来 判断 是 否 是 文件 。 
【 例 8-17】 判 断 是 否 是 文件 。 

import pathlib 

path = 'E:\ 新 建文 件 夹 ' 


PATH = pathlib.Path (path) 
print (PATH.is file()) 


程序 运行 结果 如 图 8-18 所 示 。 图 8-18 判断 是 否 是 文件 结果 
可 以 看 到 指定 的 路 径 不 是 文件 。 也 可 以 用 os 模块 来 判断 指定 的 文件 是 否 存 在 。 

【 例 8-18】 判 断 文件 是 否 存在 。 

import os 

path = 'E:\ 新 建文 件 夹 ' 


PATH = os.path.isfile(path) 
print (PATH) 


程序 运行 结果 如 图 8-19 所 示 。 


图 8-19 判断 文件 是 否 存 在 结果 


8.2.7 ”批量 文件 重 命名 
【 例 8-19】 批量 文件 重 命名 。 


import os 
import re 
import sys 


def add mark(): 
pre = input ("请 输入 需要 添加 的 前 级 :") 
mark = "[%5]"%pre 
old names= os.1istdir() 
for old name in old names: 
if old name != sys.argv[0]: 
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os.rename (old name, mark+old name) 
def remove mark(): 
old names= os.1istdir() 
for old name in old names: 
try: 
result = re-match(r"(^\[.*\]) (.*)", old name) .group (2) 
rm = old name 


if result: 
os.rename (old name, result) 
print ("已 为 $s 移 除 前 级 "%rm) 
except Exception as e: 
pass 


def main(): 
while True: 
option = int (input ("请 选择 功能 数值 :\n1 .添加 前 级 \n2 .删除 前 级 \n3. 退 出 程序 \n") ) 
if option == 1: 
add mark() 
elif option == 2: 
remove mark() 
else: 
exit () 


if name ==" main ": 


main() 


上 述 实例 可 以 批量 修改 文件 的 名 字 ， 读 者 可 以 自行 体验 程序 ， 这 里 就 不 做 介绍 了 。 


8.3 编译 可 执行 文件 


Python 编译 可 执行 文件 的 方式 有 三 种 ， 分 别 是 py2exe、PyInstaller 和 cx_freeze。 下 面 主要 讲解 py2exe 
和 cx_freeze 生成 可 执行 文件 的 方法 。 


8.3.1 用 py2exe 生成 可 执行 程序 


首先 需要 下 载 py2.exe， 在 命令 行 中 输入 : 
pip install py2exe 


安装 成 功 的 结果 如 图 8-20 所 示 。 


图 8-20 ”安装 py2.exe 结果 


安装 后 ， 下 面 以 一 个 简易 的 脚本 为 例 ， 生 成 可 执行 程序 的 脚本 。 
【 例 8-20】 生 成 可 执行 程序 的 脚本 。 
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print ('This is a py2exe test.') 
for x in range(1,10): 

print ('This num is '+str(x)) 
input ("waiting") 
【 例 8-21】 写 一 个 配置 脚本 。 
from distutils.core import setup 
import py2exe 
setup (console=['main.py']) 


注意 ，console 的 值 是 需要 生成 可 执行 程序 的 脚本 名 。 
下 面 需要 在 命令 行 中 进行 操作 。 

(1) 保证 命令 行 在 脚本 目录 下 ; 

(2) 使 用 python setup.py py2exe 生成 。 

可 以 看 见 许 多 生成 信息 ， 如 图 8-21 所 示 。 


KERNET 


图 8-21 生成 信息 
此 后 会 在 当前 目录 下 生成 一 个 disk 目录 ， 里 面 就 包含 着 可 执行 程序 ， 如 图 8-22 所 示 。 
双击 main 可 直接 运行 ， 程 序 运行 结果 如 图 8-23 所 示 。 


bz2.pyd 
ctypes.pyd 
hashlib,pyd 
ey ee 
prepatpyd 站 


num 
select pyd num 


timecodeeta pyd 
图 8-22 目录 图 8-23 ”运行 结果 
至 此 ， 生 成 可 执行 程序 结束 。 可 以 看 见 使 用 py2exe 生成 可 执行 程序 最 大 的 优点 在 于 让 脚本 脱离 了 
Python 虚拟 机 的 要 求 ， 这 对 简易 用 户 的 使 用 是 非常 友好 的 。 当 然 ， 缺 点 就 是 生成 了 许多 关联 性 的 文件 〈 必 
须 放 在 一 块 )， 而 且 这 些 文件 都 不 小 ， 从 disk 目录 中 就 可 以 看 出 来 。 


8.3.2 用 cx_freeze 生成 可 执行 文件 1 


首先 ， 下 载 本 机 器 安装 的 Python 相应 版 本 的 cx_freeze 软件 包 (下载 地 址 http://sourceforge.net/projects/ 


cx-freeze/files/4.3.2/)。 
安装 完成 后 ， 在 Python 的 安装 目录 下 ,打开 cmd 输入 “cxfreeze -version” 检 测 是 否 安装 成 功 。 安 装 成 


功 如 图 8-24 所 示 。 


请 坟 光 
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8-24 ”安装 成 功 的 实例 
安装 成 功 后 ， 新 建 一 个 Python 程序 ， 例 如 hellopy (在 DD 盘 中 )， 然 后 在 cxfreeze 命令 所 在 目录 下 ， 进 
入 cmd, 输入 命令 “cxfreeze D:/hello.py --target-dir D:/123”, 就 可 以 将 D:/hello.py 文件 打包 到 D:/123 目录 下 ， 
生成 hello.exe 程序 和 相关 依赖 文件 。 生 成 的 依赖 文件 如 图 8-25 所 示 。 


br2.pyd 
helo oe 
% python33 .dl 


unicodedata pyd 


图 8-25 依赖 文件 
当然 ， 这 是 比较 简单 的 程序 ， 所 以 相关 的 依赖 文件 比较 少 ， 当 引入 外 部 包 比较 多 ， 并 且 希 望 只 生成 一 
个 .exe 文件 的 时 候 ， 可 以 使 用 如 下 命令 。 


cxfreeze D:/hello.py --target-dir D:/123 --no-copy-deps 


8.4 就 业 面试 技巧 与 解析 


面试 官 : 一 个 大 小 为 100GB 的 文件 log.txt, 要 读 取 文件 中 的 内 容 ， 写 出 具体 过 程 代码 。 
应 聘 者 : 

方法 一 : 利用 open0 系 统 自 带 方法 生成 的 迭代 对 象 : 

with open("./data/1og.txt",encoding='utf8') as f: 


for line in f: 
print (line) 


for line if 这 种 用 法 是 把 文件 对 象 了 当 作 和 迭代 对 象 ， 系 统 将 自动 处 理 IO 缓冲 和 内 外 部 存储 文件 的 读 写 


方法 二 : 将 文件 切 分 成 小 段 ， 每 次 处 理 完小 段 内 容 后 ， 释 放 内 存 ， 这 里 会 使 用 yield 生成 自 定义 可 迭代 
对 象 ， 即 generator， 每 一 个 带 有 yield 的 函数 就 是 一 个 generator。 

def read in block(file path): 

BLOCK_SIZE = 1024 

with open (file path, "r",encoding='utf8') as f: 

while True: 

block = f.read (BLOCK_SIZE) # 每 次 读 取 固 定 长 度 到 内 存 缓冲 区 

if block: 

yield block 

else: 

return # 如 果 读 取 到 文件 末尾 , 则 退出 

file path = "./data/log.txt" 

for block in read in block(file path): 

print (block) 
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数据 格式 化 


> 学 习 指引 


本 章 讲解 Python 中 有 关 数 据 格式 化 的 内 容 ， 其 中 包括 二 维 数据 的 处 理 ， 网 络 传输 数据 的 处 理 等 。 


5 重点 导读 


“了 解数 据 的 维度 。 
“掌握 二 维 数据 的 格式 化 和 处 理 方法 。 
“掌握 二 维 数据 的 直观 表示 方法 。 


* 掌握 高 维 数据 的 格式 化 方法 。 
。 掌 握 数据 格式 的 相互 转化 方法 。 
。 掌 握 数据 的 格式 化 方法 。 
9.1 数据 的 维度 
数据 维度 是 一 种 抽象 的 概念 ， 在 计算 机 中 任何 数据 都 是 以 一 维 形式 进行 存储 的 ， 多 维 只 是 为 了 方便 人 
类 的 阅读 与 查看 。 


个 数据 表达 一 个 含义 ， 一 组 数据 表达 一 个 或 多 个 含义 。 

维度 : 一 组 数据 的 组 织 形式 〈 一 维 、 二 维 或 多 维 )。 

一 维 数据 由 对 等 关系 的 有 序 或 无 序数 据 构成 ， 采 用 线性 方式 组 织 。 

二 维 数据 由 多 个 一 维 数据 构成 ， 是 一 维 数据 的 组 合 形式 ， 例 如 表格 就 是 二 维 数据 的 一 种 。 
多 维 数据 由 一 维 或 二 维 数 据 在 新 维度 上 进行 扩展 ， 例 如 加 上 时 间 维 度 。 
高 维 数 据 利用 最 简单 的 二 元 关系 展示 数据 间 的 复杂 结构 ， 例 如 说 键 值 对 。 
1. Python 中 数据 的 维度 

一 维 数据 列表 和 集合 类 型 。 

二 维 或 多 维 数据 : 列表 。 

高 维 数据 : 字典 、JSON、XML、YAML。 

2. 数据 的 操作 周期 

存储 : 在 文件 中 的 表现 形式 。 
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表示 : 在 程序 中 的 表现 形式 。 

操作 : 数据 存储 形式 和 表现 形式 之 间 的 转换 和 处 理 。 

3. 一 维 数据 的 表示 和 存储 

1) 一 维 数据 的 表示 

如 果 数 据 有 序 ， 可 使 用 列表 类 型 。 列 表 类 型 可 以 表达 一 维 有 序数 据 ，for 循环 可 以 遍历 数据 ， 进 而 对 4 
一 个 数据 进行 处 理 。 


母 


如 果 无 序 ， 可 使 用 集合 类 型 。 集 合 类 型 可 以 表达 一 维 无 序数 据 ，for 循环 可 以 遍历 集合 ， 进 而 对 每 一 个 


数据 进行 处 理 。 
2) 一 维 数据 的 存储 
(1) 空格 分 开 ， 不 换行 。 缺 点 是 数据 中 不 能 存在 空格 。 
(2) 喜 号 分 隔 ， 不 换行 。 缺 点 是 数据 中 不 能 存在 逗号 。 


(3) 其 他 方式 ， 可 以 利用 特殊 符号 或 者 特殊 符号 组 合 进行 分 隔 ， 例 如 $'。 缺 点 是 需要 根据 数据 特点 进 


行 定义 ， 通 用 性 比较 差 。 
4. 一 维 数据 的 操作 


一 维 数据 的 操作 ， 指 的 是 数据 存储 格式 和 表达 方式 之 间 的 转换 ， 例 如 ， 将 存储 的 数据 读 入 程序 、 将 程 


序 表示 的 数据 写 入 文件 。 
下 面 给 出 一 段 实例 代码 ， 具 体 代 码 如 下 。 
动作 5 爱情 $ 言 情 $ 剧 情 $ 科 幻 $ 悬 颖 
txt=f.open (data.txt) .read() 
1s=txt.split ("$") 
f.close() 


写 入 文件 : 
1s=[' 动 画 ',' 少 儿 '] 
f=open (fname, 'w') 


f.write(' '.join(1s)) 
f.close() 


9.2 ”二 维 数据 的 格式 化 和 处 理 


本 节 讲 解 二 维 数据 的 格式 化 和 处 理 ， 二 维 数据 是 一 维 数据 向 多 维 数据 转化 的 初探 ， 因 此 只 要 能 够 理解 


二 维 数据 ， 多 维 数据 也 就 理解 了 。 


.2.1 二 维 数据 的 存储 格式 


在 Python 中 的 二 维 数据 可 以 使 用 列表 来 体现 ， 当 然 也 有 国际 通用 CSV 数据 格式 。 
1. 二 维 数据 的 表示 


列表 类 型 可 以 表达 二 维 数据 ,使 用 的 列表 是 二 维 列表 ,使 用 两 层 for 循环 遍历 列表 的 每 一 个 元 素 , 外 层 


列表 中 的 每 一 个 元 素 可 以 对 应 表格 的 一 行 或 者 一 列 。 
2. CSV 数据 存储 格式 


CSV 数据 存储 格式 是 国际 通用 的 一 种 二 维 数据 存储 格式 ， 一 般 以 .csv 为 扩展 名 ， 每 行 一 个 一 维 数据 ， 
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采用 逗号 分 隔 ， 无 空 行 。 

了 Excel 软件 可 读 入 输出 ， 一 般 编 辑 软件 都 可 以 产生 ， 如 果 某 个 元 素 缺失 ， 喜 号 仍 要 保留 。 二 维 数据 的 表 
头 可 以 作为 数据 存储 ， 也 可 以 另行 存储 。 符 合 一 般 索 引 习 惯 ，ls[row][cokumn]， 先 行 后 列 。 

例如 ， 类 表 类 型 可 以 表示 二 维 数 据 : 

[[424,23423,2342], [131, 535, 3646]] 

使 用 两 层 for 循环 可 以 遍历 每 个 元 素 ， 外 层 列 表 中 每 个 元 素 可 以 对 应 一 行 ， 也 可 以 对 应 一 列 。 一 维 数据 
分 为 列表 和 集合 类 型 ， 二 维 数据 只 有 列表 类 型 。 


加 
9 .2.2 ”二 维 数据 的 表示 和 读 写 
1. 从 CSYV 格式 的 文件 中 读 入 数据 


fo = open (fname) 
:| 
for line in fo: 
line = line.replace("\n","") 
1s.append (line.split(",")) 
fo.close() 


2. 二 维 数据 的 写 入 处 理 


ls5= [007 0] 

f = open (fname,''w') 

for item in 1s: 
f.write(','.join(item) + '\n') 

f.close() 


3. 二 维 数据 的 逐一 处 理 


Ts = [OIG 
for row in 1s: 
for column in row: 
print (ls[row] [column]) 


4. wordcloud 库 的 使 用 


cmd 命令 行 ， pip install wordcloud// 安 装 wordcloud 库 
Wordcloud.Wordcloud () 代表 一 个 文本 对 应 的 词 云 


wordcloud 库 常 规 方法 见 表 9-1。 


表 9-1 wordcloud 库 常 规 方法 


方 法 描 述 
w.generate(txt) 向 对 象 w 中 加 载 文本 txt，>>>w.generate("afwawfawf"') 
w.to_file(filename) 将 词 云 输出 为 图 像 文 件 ，png 或 jpg>>>w.to_file("outfile.png") 


配置 对 象 参 数 见 表 9-2。 


表 9-2 配置 对 象 参数 
参 数 描 述 
指定 词 云 对 象 生成 图 片 的 宽度 ， 默 认为 400 像素 

>>>w=wordcloud. WordCloud(width=600) 


width 
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续 表 
参数 描 述 
height 高 度 ， 默 认为 200 像素 
min font size 指定 词 云 中 字体 的 最 小 字号 ， 默 认为 4 号 
max font size 最 大 字号 ， 根 据 高 度 自动 调节 
font_step 指定 词 云 中 字体 字号 的 步 进 间隔 默认 为 1 


指定 字体 文件 的 路 径 ， 默 认为 None 


a >>>w=wordcloud. WordCloud(font_path="msyh.ttc") 
max_words 指定 词 云 最 大 单词 数量 ， 默 认为 20 
stop_words 指定 词 云 的 排除 词 列 表 

指定 词 云 形状 ， 默 认为 长 方形 ， 需 要 引用 imread0 函 数 
二 >>>from cipy.misc import imread 


>>>mk=imread("pic.png") 
>>>wW=wWordcloud.WordCloud(mask=mk) 


background_color 指定 词 云图 片 的 背景 颜色 ， 默 认为 黑色 


9.3 ”二 维 数据 的 直观 表示 


二 维 数 据 是 一 维 数据 的 组 合 形式 ， 由 多 个 一 维 数据 组 合 形成 。 列 表 类 型 可 以 表达 二 维 数据 ， 使 用 的 列 
表 是 二 维 列表 , 使 用 两 层 for 循环 遍历 列表 的 每 一 个 元 素 , 外 层 列表 中 的 每 一 个 元 素 可 以 对 应 表格 的 一 行 或 
者 一 列 。 二 维 数据 的 直观 显示 是 通过 CSV 格式 使 用 HTML 文档 展示 的 。 


$9.3.1 HTML 简介 


HTML (Hyper Text Makeup Language， 超 级 文本 标记 语言 ) 是 标准 通用 标记 语言 下 的 一 个 应 用 ， 也 是 一 
种 规范 ， 一 种 标准 ， 它 通过 标记 符号 来 标记 要 显示 的 网 页 中 的 各 个 部 分 。 

网 页 文件 本 身 是 一 种 文本 文件 ， 通 过 在 文本 文件 中 添加 标记 符 ， 可 以 告诉 浏览 器 如 何 显 示 其 中 的 内 容 
〈 如 文字 如 何 处 理 ， 画 面 如 何 安排 ， 图 片 如 何 显示 等 )。 浏 览 器 按 顺序 阅读 网 页 文件 ， 然 后 根据 标记 符 解释 
和 显示 其 标记 的 内 容 ， 对 书写 出 错 的 标记 将 不 指出 其 错误 ， 且 不 停止 其 解释 执行 过 程 ， 编 制 者 只 能 通过 显 
示 效 果 来 分 析出 错 原因 和 出 错 部 位 。 但 需要 注意 的 是 ， 对 于 不 同 的 浏览 器 ， 对 同一 标记 符 可 能 会 有 不 完全 
相同 的 解释 ， 因 而 可 能 会 有 不 同 的 显示 效果 。 

HTML 的 特点 如 下 。 

(1) 简易 性 : 超级 文本 标记 语言 版 本 升级 采用 超 集 方式 ， 从 而 更 加 灵活 方便 。 

(2) 可 扩展 性 ， 超级 文本 标记 语言 的 广泛 应 用 带 来 了 加 强 功能 、 增 加 标识 符 等 要 求 ， 超 级 文本 标记 语 
言 采取 子 类 元 素 的 方式 ， 为 系统 扩展 带 来 保证 。 

(3) 平台 无 关 性 : 虽然 个 人 计算 机 大 行 其 道 ， 但 使 用 MAC 等 其 他 机 器 的 大 有 人 在 ， 超 级 文本 标记 语 
言 可 以 使 用 在 广泛 的 平台 上 ， 这 也 是 万 维 网 C(WWW) 盛行 的 另 一 个 原因 。 

(4) 通用 性 : HTML 是 网 络 的 通用 语言 ， 是 一 种 简单 、 通 用 的 全 置 标记 语言 ， 它 允许 网 页 制作 人 建立 
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文本 与 图 片 相 结 合 的 复杂 页 面 ， 这 些 页 面 可 以 被 网 上 任何 其 他 人 浏览 到 ， 无 论 使 用 的 是 什么 类 型 的 计算 机 
或 浏览 器 。 

简单 理解 :正如 我 们 写 的 Python 代码 ， 解 释 器 是 Python，HTML 的 代码 解释 器 就 是 浏览 器 ， 解 释 器 当 
然 就 有 相应 的 解释 “规则 ”， 而 这 些 规则 就 是 HTML。 


<!DOCTYPE html> #HTML 文档 类 型 ,这 个 是 HTML5 写法 
<html> 

<head> 

</head> 

<body> 

</body> 
</html> 


以 html 开头 和 html 结尾 ， 中 间 包 含 head 和 body， 如 果 把 html 看 作 人 ， 那 么 head 就 是 头 ，body 就 是 
身体 ， 所 以 头 部 里 的 东西 一 般 都 是 看 不 见 的 。 

<head> 和 </head> 之 间 的 内 容 ， 是 元 信息 和 网 站 的 标题 元 信息 ， 一 般 是 不 显示 出 来 的 ， 但 是 记录 了 该 
HTML 文件 的 很 多 有 用 的 信息 。 

<body> 和 </body> 之 间 的 内 容 , 是 浏览 器 呈现 出 来 的 , 即 用 户 看 到 的 页 面 效 果 。 这 里 是 网 页 的 主题 内 容 。 

HTML 是 一 种 标签 语言 ， 诸 如 <head>、<body>、<table> 等 被 尖 插 号 “<” 和 “>” 包 起 来 的 对 象 ， 绝 大 
部 分 的 标签 都 是 成 对 出 现 的 , 如 <table></talbe>、<form></form>。 当然 还 有 少 部 分 不 是 成 对 出 现 的 , 如 <br>、 
<hr> 等 。 标 签 可 以 嵌 套 ， 例 如 在 body 标签 中 嵌 套 form 标签 ， 在 form 中 又 可 以 嵌 套 其 他 标签 。 

1. 标签 分 类 

闭合 标签 ， 有 开始 标签 和 结束 标签 ， 必 须 成 对 出 现 ， 例 如 <html></html>。 

自 闭合 标签 ， 单 个 存在 的 标签 ， 自 己 封闭 ， 如 <br/>, 这 里 不 加 /也 不 会 出 错 。 

1) head 标签 

head 头 部 中 包含 的 标记 是 页 面 的 标题 、 序 言 、 说 明 等 内 容 ， 它 本 身 不 作为 内 容 来 显示 ， 但 影响 网 页 显 
示 的 效果 。 头 部 中 最 常用 的 标记 符 是 标题 标记 符 和 meta 标记 符 ， 其 中 ， 标 题 标 记 符 用 于 定义 网 页 的 标题 ， 
它 的 内 容 显示 在 网 页 窗口 的 标题 栏 中 ， 网 页 标题 可 被 浏览 器 用 作 书 签 和 收藏 清单 。 

设置 文档 标题 和 其 他 在 网 页 中 不 显示 的 信息 ， 例 如 方向 direction、 语 言 代 码 Language Code( 实 体 定 
义 !IENTITY %il8n)、 字 典 中 的 元 信息 ， 等 等 。 

title: 在 head 中 是 为 数 不 多 的 能 在 网 页 中 显示 的 标签 ， 效 果 是 显示 网 页 的 名 字 。 

<title>hello wd</title> 

meta: 定义 了 一 个 文档 和 外 部 资源 之 间 的 关系 , 提供 有 关 页 面 的 元 信息 ， 如 页 面 编 码 、 刷 新 、 跳 转 、 针 
对 搜索 引擎 和 更 新 频 度 的 描述 和 关键 词 、 页 面 编码 。 

设置 编码 : 

<meta charset="UTF-8"> 

自动 刷新 页 面 : 

<meta http-equiv="Refresh"” content="3"> #3 秒 刷新 一 次 页 面 

跳 转 : 

<meta http-equiv="refresh" content="3;Url=http://www.baidu.com">#3 秒 钟 后 跳 转 至 www.baidu.com 

关键 字 信息 : 

<meta name="keywords" content="this is wd home"> 


兼容 IE: X-UR-Compatible 
<meta http-equiv="X-UA-Compatible" content="IE=IE9;IE=IE8;IE=EmulateIE7" /> 
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提示 : 微软 的 IE 6 是 通过 Windows XP、Windows 2003 等 操作 系统 发 布 出 来 ， 作 为 占 统治 地 位 的 桌面 
操作 系统 ， 也 使 得 正 占据 了 统治 地 位 ， 许 多 网 站 在 开发 的 时 候 ， 就 按照 IE 6 的 标准 去 开发 ， 而 IE 6 自身 
的 标准 也 是 微软 公司 内 部 定义 的 。 到 了 正 7 出 来 的 时 候 ， 采 用 了 微软 公司 内 部 标准 以 及 部 分 W3C 的 标准 ， 
这 个 时 候 许 多 网 站 升级 到 IE 7 就 比较 痛苦 ， 很 多 代码 必须 调整 后 才能 够 正常 运行 。 而 到 了 微软 的 下 8， 基 
本 上 把 微软 内 部 自己 定义 的 标准 抛 齐 了 ， 而 全 面 支持 W3C 的 标准 ， 由 于 基于 对 标准 彻底 的 变化 ， 使 得 原先 
在 早期 IE 8 版 本 上 能 够 访问 的 网 站 ， 在 JE 8 中 无 法 正常 访问 ,会 出 现 一 些 排版 错乱 、 文 字 重 又 、 显 示 不 全 
等 兼容 性 错误 。 

与 任何 早期 浏览 器 版 本 相 比 ， 正 8 对 行业 标准 提供 了 更 加 紧密 的 支持 。 因 此 ， 针 对 旧版 本 浏览 器 设计 
的 站 点 可 能 不 会 按 预 期 显示 。 为 了 帮助 减轻 任何 问题 ，IE 8 引入 了 文档 兼容 性 的 概念 ， 从 而 允许 用 户 指 定 
站 点 所 支持 的 正 版 本 。 文 档 兼容 性 在 下 8 中 添加 了 新 的 模式 ;这些 模式 将 告诉 浏览 器 如 何 解释 和 呈现 网 站 。 
如 果 站 点 在 下 8 中 无 法 正确 显示 ， 则 可 以 更 新 该 站 点 以 支持 最 新 的 Web 标准 (首选 方式 )， 也 可 以 强制 下 
8 按照 在 旧版 本 的 浏览 器 中 查看 站 点 的 方式 来 显示 内 容 。 通 过 使 用 meta 元 素 将 X-UA-Compatible 标 头 添加 
到 网 页 中 ， 可 以 实现 这 一 点 。 

当 正 8 遇 到 未 包含 X-UA-Compatible 标 头 的 网 页 时 ， 它 将 使 用 指令 来 确定 如 何 显示 该 网 页 。 如 果 该 指 
令 丢 失 或 未 指定 基于 标准 的 文档 类 型 ， 则 正 8 将 以 正 5 模式 (Quirks 模式 ) 显示 该 网 页 。 

Link 

<link> 


< link rel="stylesheet" type="text/css" href="css/common.css" > 

icon 

< link rel="shortcut icon" href="image/favicon.ico"># 图 标 

2) body 标签 

分 类 如 下 。 

块 级 标签 :标签 独占 一 行 ， 如 a、div、select。 

行内 标签 :标签 本 身 占 多 少 页 面 上 就 占 多 少 ， 如 p、h、span。 

特殊 符号 (常见 ): 

&nbsp: 空 格 

&gt: > (大 于 ) 

&lt: < (小 于 ) 

<br/>: 换 行 

(1) 标题 : h 标签 。 

标题 通过 hl 一 h6 来 定义 ， 字 号 大 小 递增 。 

<hl>wd</h1l> 

<h6>wd</h6> 

(2) 段落 : p 标签 。 

P 段落 标签 是 块 级 标签 ， 段 落 与 段落 之 间 有 间距 ， 并 可 以 说 套 换行 标签 <br/>。 

<p> 段 落 1</p> 

<p> 段 落 2</p> 

<p> 段 落 3<br/> 这 里 换行 了 </p> 

(3) div 标签 : 可 理解 为 “白板 ”， 本 身 不 对 内 容 做 任何 演 染 ， 后 续 会 提 及 如 何 使 用 style 来 泻 染 ， 
属于 块 级 标签 。 
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ynaneisw/ai> 
(4) span 标签 : 同 div 一 样 ，span 也 是 空白 ， 本 身 不 对 内 容 做 泻 染 ， 但 是 属于 行内 标签 。 


(5) a 标签 : 是 应 用 网 站 链接 使 用 的 标签 ， 可 以 是 图 片 或 者 其 他 HTML 元 素 。 


target 属性 : 定义 超 链接 是 在 当前 窗口 显示 还 是 新 窗口 显示 。 


href 中 通过 设置 #+ 标 签 id 关联 跳 转 ， 实 质 上 也 是 跳 转 。 


(6) input 标签 : 是 使 用 最 多 的 标签 之 一 ， 并 且 其 属性 有 多 种 ， 不 同 的 属性 对 应 着 不 同样 式 。 
下 面 主要 介绍 type 属性 。 

@ text: 文本 。 输 入 的 字符 串 为 文本 。 

@ password: 密码 。 输 入 的 字符 串 为 密 文 。 

图 button: 按钮 。 默 认 并 无 实际 作用 ， 后 续 会 在 JS 中 提 及 其 作用 。 

@ submit: 提交 。 提 交 fom 表单 使 用 。 

@) value: 属性 值 。 

@ name: 为 传输 的 内 容 设置 key， 方 便 后 台 取 数据 。 

这 里 给 出 一 段 实 例 ， 具 体 代码 如 下 。 


还 有 其 他 标签 ， 感 兴趣 的 读者 可 以 自行 查阅 。 
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,9.3.2 ”CSV 格式 使 用 HTML 文档 展示 


Python 中 将 CSV 格式 文件 使 用 HTML 进行 展示 。CSV 本 身 是 二 维 数据 ，HTML 也 是 二 维 数据 ， 因 此 
们 之 间 可 以 转换 。 
下 面 给 出 一 段 实例 ， 具 体 代码 如 下 。 


第 贺 章 数据 格式 化 


9.4 高 维 数据 的 格式 化 


高 维 数据 在 Python 中 使 用 了 JSON 与 XML 两 种 格式 ， 它 们 是 用 于 进行 网 络 传输 的 数据 格式 。 


9.4.1 JSON 格式 


JSON (JavaScript Object Notation，JS 对 象 标记 ) 是 一 种 轻 量 级 的 数据 交换 格式 ， 它 基于 ECMAScript 
(欧洲 计算 机 协会 制定 的 JS 规范) 的 一 个 子 集 ， 采 用 完全 独立 于 编程 语言 的 文本 格式 来 存储 和 表示 数据 。 

1. JSON 语法 规则 

(1) 对 象 表示 为 键 值 对 ; 
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(2) 数据 由 逗号 分 隔 ; 
(3) 花 括 号 保存 对 象 ; 
(4) 方 括号 保存 数组 。 


2. JSON 键 值 对 

JSON 键 值 对 是 用 来 保存 JS 对 象 的 一 种 方式 ， 和 JS 对 象 的 写法 也 大 同 小 异 ， 键 值 对 组 合 中 的 键 名 写 在 
前 面 并 用 双 引 号 "" 包 衰 ， 使 用 冒号 〈: ) 分 隔 ， 然 后 紧 接着 值 。 

{"firstName": "Json"} 

3. JSON 与 JS 对 象 的 关系 

很 多 人 搞 不 清楚 JSON 和 JS 对 象 的 关系 ， 甚 至 连 谁 是 谁 都 不 清楚 ， 其 实 可 以 这 么 理解 

JSON 是 JS 对 象 的 字符 串 表示 法 ， 它 使 用 文本 表示 一 个 JS 对 象 的 信息 ， 本 质 是 一 个 字符 串 。 

例如 

var obj = {a: 'Hello', b: 'World'}; // 这 是 一 个 对 象 , 注意 键 名 也 是 可 以 使 用 引号 包 衷 的 

var json = '{"a": "Hello"，"b": "World"}'; // 这 是 一 个 JSON 字符 串 , 本 质 是 一 个 字符 串 

在 JS 语言 中 ， 一 切 都 是 对 象 。 因 此 ， 任 何 支持 的 类 型 都 可 以 通过 JSON 来 表示 ， 例 如 字符 串 、 数 字 、 
对 象 、 数 组 等 。 但 是 对 象 和 数组 是 比较 特殊 且 常 用 的 两 种 类 型 。 

对 象 在 JS 中 是 使 用 花 括 号 入 包 衷 起 来 的 内 容 ， 数 据 结构 为 {key1: valuel, key2: value2, …} 的 键 值 对 结 
构 。 在 面向 对 象 的 语言 中 ，key 为 对 象 的 属性 ，value 为 对 应 的 值 。 键 名 可 以 使 用 整数 和 字符 串 来 表示 。 值 
的 类 型 可 以 是 任意 类 型 。 

数组 在 JS 中 是 方 括号 [] 包 衷 起 来 的 内 容 ， 数 据 结构 为 ["java","javascript","vb",…] 的 索引 结构 。 在 JS 中， 
数组 是 一 种 比较 特殊 的 数据 类 型 ， 它 也 可 以 像 对 象 那样 使 用 键 值 对 ， 但 还 是 索引 使 用 得 多 。 同 样 ， 值 的 类 
型 可 以 是 任意 类 型 。 

例如 : 


{ "people":[ 
{"firstName": "Brett","]lastName":"McLaughlin"}, 
{"firstName":"Jason","lastName":"Hunter"} ] 


} 


.4.2 XML 格式 


可 扩展 标记 语言 (标准 通用 标记 语言 的 子 集 〉 是 一 种 简单 的 数据 存储 语言 ， 使 用 一 系列 简单 的 标记 描 
述 数据 ， 而 这 些 标记 可 以 用 简单 的 方式 建立 。 虽 然 可 扩展 标记 语言 占用 的 空间 比 二 进 制 数据 要 更 多 ， 但 可 
扩展 标记 语言 极其 简单 ， 易 于 掌握 和 使 用 。 
XML 的 前 身 是 标准 通用 标记 语言 ， 是 自 IBM 从 20 世纪 60 年 代 就 开始 发 展 的 通用 标记 语言 。 
同 HIML 一 样 ， 可 扩展 标记 语言 是 标准 通用 标记 语言 的 一 个 子 集 ， 它 是 描述 网 络 上 的 数据 内 容 和 结构 
的 标准 。 尽 管 如 此 ，XML 不 像 HIML，HTML 仅 提 供 了 在 页 面 上 显示 信息 的 通用 方法 (没有 上 下 文 相 关 和 
动态 功能 )，XML 则 对 数据 赋予 上 下 文 相关 功能 ， 它 继承 了 标准 通用 标记 语言 的 大 部 分 功能 ， 却 使 用 了 不 
太 复 杂 的 技术 。 

为 了 使 标准 通用 标记 语言 显得 用 户 友 好 ，XML 重新 定义 了 标准 通用 标记 语言 的 一 些 内 部 值 和 参数 ， 去 
掉 了 大 量 的 很 少 用 到 的 功能 , 这 些 繁杂 的 功能 使 得 标准 通用 标记 语言 在 设计 网 站 时 显得 复杂 化 。 XML 保留 
了 标准 通用 标记 语言 的 结构 化 功能 ,这样 就 使 得 网 站 设计 者 可 以 定义 自己 的 文档 类 型 ， XML 同时 也 推出 了 
一 种 新 型 文档 类 型 ， 使 得 开发 者 也 可 以 不 必定 义 文档 类 型 。 
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XML 与 HIML 的 主要 差异 如 下 。 

(1) XML 不 是 HIML 的 替代 。 

(2) XML 和 HTML 为 不 同 的 目的 而 设计 。 

(3) XML 被 设计 为 传输 和 存储 数据 ， 其 焦点 是 数据 的 内 容 。 

(4) HTML 被 设计 用 来 显示 数据 ， 其 焦点 是 数据 的 外 观 。 

(5) HTML 旨 在 显示 信息 ， 而 XML 旨 在 传输 信息 。 

XML 只 是 用 于 传输 数据 的 ， 因 此 XML 不 会 做 任何 事情 。XML 被 设计 用 来 结构 化 、 存 储 以 及 传输 


信息 。 
例如 ， 下 面 是 John 写 给 George 的 便签 ， 存 储 为 XML 。 
<note> 

<to>George</to> 

<from>John</from> 

<heading>Reminder</heading> 

<body>Don't forget the meeting!</body> 

</note> 


上 面 的 这 条 便签 具有 自我 描述 性 。 它 拥有 标题 以 及 留言 ， 同 时 包含 发 送 者 和 接收 者 的 信息 。 

但 是 ， 这 个 XML 文档 仍然 没有 做 任何 事情 。 它 仅仅 是 包装 在 XML 标签 中 的 纯粹 的 信息 。 我 们 需要 编 
写 软件 或 者 程序 ， 才 能 传送 、 接 收 和 显示 出 这 个 文档 。 

XML 没什么 特别 的 ， 它 仅仅 是 纯 文 本 而 已 。 所 有 可 以 编辑 纯 文 本 的 软件 都 可 以 处 理 XML .。 不 过 ， 
能 够 读 懂 XML 的 应 用 程序 可 以 有 针对 性 地 处 理 XML 的 标签 。 标 签 的 功能 性 意义 依赖 于 应 用 程序 的 

通过 XML 用 户 也 可 以 发 明 自 己 的 标签 。 

上 例 中 的 标签 没有 在 任何 XML 标准 中 定义 过 (例如 <to> 和 <from>)， 这 些 标签 是 由 文档 的 创作 者 发 
明 的 。 这 是 因为 XML 没有 预定 义 的 标签 。 

而 在 HTML 中 使 用 的 标签 (以 及 HTML 的 结构 ) 是 预定 义 的 。HTML 文档 只 使 用 在 HTML 标准 中 定 
义 过 的 标签 (例如 <p>、<h1> 等 )。 

XML 不 会 替代 HTML, 理解 这 一 点 很 重要 。 在 大 多 数 Web 应 用 程序 中 , XML 用 于 传输 数据 , 而 HTML 
用 于 格式 化 并 显示 数据 。 


9.5 ”数据 格式 的 相互 转换 


多 维 数 据 同 二 维 数据 一 样 ， 也 是 可 以 相互 转换 的 ， 本 节 讲 解 JSON 库 的 使 用 以 及 CSV 与 JSON 之 间 的 
转换 。 


9.5.1 JSON 库 的 使 用 


[Ee 
JSON 通常 用 于 在 Web 客户 端 和 服务 器 间 进 行 数据 交换 ， 即 把 字符 串 类 型 的 数据 转换 成 Python 基本 数 
据 类 型 ， 或 者 将 Python 基本 数据 类 型 转换 成 字符 串 类 型 ， 为 此 Python 中 提供 了 标准 JSON 库 。 
使 用 JSON 函数 需要 导入 JSON 库 : import json。 
常用 方法 见 表 9-3。 
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表 9-3 JSON 函数 常见 方法 


方 法 说 明 
json loads(obj) 将 字符 串 序列 化 成 Python 的 基本 数据 类 型 ， 注 意 单 引号 与 双 引 号 
json.dumps(obj) 将 Python 的 基本 数据 类 型 序列 化 成 字符 串 
json.load(obj) 读 取 文件 中 的 字符 串 ， 序 列 化 成 Python 的 基本 数据 类 型 
json.dump(obj) 将 Python 的 基本 数据 类 型 序列 化 成 字符 串 并 写 入 到 文件 中 


下 面 给 出 转换 实例 。 
(1) 将 字符 捉 序列 化 成 字典 。 
创建 一 个 字符 串 变 量 dict_str， 具 体 代码 如 下 。 


23> ict SEE = VIEL "yy ky2 
# 数 据 类 型 为 str 

>>> type (dict str) 

<class 'str'> 


(2) 将 字符 串 变 量 dict_str 序列 化 成 字典 格式 ， 具 体 代码 如 下 。 


>>> import json 

>>> dict json = json.loads (dict str) 
(3) 查看 数据 类 型 并 输出 内 容 。 

>>> type (dict json) 

# 数 据 类 型 被 序列 化 成 字典 格式 了 

<class 'dict'> 

>>> dict_ json 

{kl vi, rk2': rv2'} 

(4) 将 一 个 列表 类 型 的 变量 序列 化 成 字符 串 类 型 。 
>>> json_1i = [11,22,33,44] 

+ 数据 类 型 为 list 

>>> type (json 1i) 

<class 'list'> 


(5) 将 字符 串 类 型 转换 为 Python 的 基本 数据 类 型 。 


>>> import json 
>>> json_str = json.dumps (json 1i) 


(6) 查看 数据 类 型 。 


>>> type (json_ str) 

<class 'str'> 

>>> json_str 

i ee a 

(7) 把 字典 当 作 字 符 串 存 入 db 文件 当中 。 
# 创 建 一 个 字典 的 数据 类 型 

>>> dic = "Ki"s1237"k2":456} 

#4 输出 类 型 及 内 容 

>>> print (type (dic), dic) 

(<type 'dict'>, {'k2': 456, kl': 123}) 
# 导 入 json 模块 


>>> import json 


Ht 
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# 将 dic 转换 为 字符 串 并 且 写 入 到 当前 目录 下 面 的 db 文件 内 ,如 果 没 有 该 文件 则 创建 
>>> json.dump (dic, open ("db", "w")) 
# 导 入 os 模块 查看 


>>> import os 

# 查 看 当前 目录 下 面 的 文件 

>>> os.system("ls -1") 

# 查 看 文件 db 的 内 容 ,最 后 面 那 个 0 是 代表 命令 执行 成 功 

>>> os.system("cat db") 

{"k2"s 4567 "ki": 123}0 

(8) 读 取 文 件 内 容 ， 把 读 取 出 来 的 字符 串 转 换 成 Python 的 基本 数据 类 型 。 
# 读 取 当 前 目录 下 面 的 db 文件 ,把 内 容 转换 为 Python 的 基本 数据 类 型 并 赋值 给 result 
>>> result = json.1load(open ("db","r")) 

# 查 看 对 象 result 的 数据 类 型 及 内 容 

>>> print (type (result), result) 

(<type 'dict'>, {u'k2': 456，u'kl': 123}) 


9.5.2 CSV 格式 和 JSON 格式 相互 转换 


本 节 讲 解 CSV 格式 数据 与 JSON 数据 之 间 的 相互 转换 ， 在 Python 中 也 提供 了 相应 的 库 函 数 。 
1. CSV 格式 转换 成 JSON 格式 

CSV 文件 内 容 如 下 。 

1 Twin Oaks Place 

10 Marquette Rd. 

12 Craven Way 

12 Fort Sheriden Ave 


12 Skokie Valley Rd 
12 Walker Ave 


120 high st 

使 用 内 置 函 数 处 理 : 

import sys // 导 入 系统 库 
import json // 导 入 JSON 库 


reload (sys) 
sys.setdefaultencoding ('utf-8') // 设 置 编码 方式 
# 根 据 列 表 中 是 否 为 空 ,将 不 为 空 的 配 成 键 值 对 更 新 到 字典 中 
def list name (keyname, valuel, dictl=None): 
dictl = dict (zip (keyname, valuel)) 
return dictl 
with open(r'D:\address.csv', 'rb') as f: 
for line in f: 


line II 
1 = 
else: 
TE no em Nn 
line = linmetl:=1] 
ne LI 


line = line[:-1] 
akk = [y for y in line.split(" ")] 
keyl = ['street','namefirst','namelast','"'address'] 
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输出 结果 如 下 。 


自己 定义 函数 ， 内 容 可 控 。 


输出 结果 如 下 。 


2. JSON 格式 转换 成 CSV 格式 


第 贺 章 数据 格式 化 


1s=json.load (fr) # 将 JSON 格式 的 字符 串 转换 成 python 的 数据 类 型 ,解码 过 程 
data=[ list(1s[0] .keys()) ] # 获 取 列 名 , 即 key 
for item in 1s: 

data.append (list (item.values ())) # 获 取 每 一 行 的 值 value 


fr.close() # 关 闭 JSON 文件 
fw=open ("C:\\Users\\Administrator\\Desktop\\price.csv", "w") # 打 开 CSV 文件 
for line in data: 

fw.write(",".join(line)+"\n") 所 以 逗号 分 隔 一 行 的 每 个 元 素 , 最 后 换行 
fw.close() 关闭 Csv 文件 


9.6 图像 数据 的 格式 化 
图 像 数据 在 计算 机 中 也 是 以 二 进 制 的 形式 进行 存放 ， 输 出 是 通过 Python 提供 的 库 函数 读 取 输 出 。 


9.6.1 PIL 库 的 安装 和 简单 使 用 


PIL (Python Imaging Library Python， 图 像 处 理 类 库 ) 提供 了 通用 的 图 像 处 理 功 能 ， 以 及 大 量 有 用 的 基 
本 图 像 操 作 ， 例 如 图 像 缩 放 、 裁 剪 、 旋 转 、 颜 色 转 换 等 。 

PIL 是 Python 一 个 强大 方便 的 图 像 处 理 库 ， 不 过 只 支持 到 Python 2.7， 因 此 如 果 选 用 Python 3.0 以 上 
版 本 可 以 选取 Pillow, Pillow 是 PIL 的 一 个 派生 分 支 , 但 如 今 已 经 发 展 成 为 比 PIL 本 身 更 具 活 力 的 图 像 处 
理 库 。 

在 命令 行使 用 PIP 安装 : pip install Pillow。 

PIL 可 以 做 很 多 和 图 像 处 理 相 关 的 事情 。 

(1) 图 像 妥 档 (Image Archives)。PIL 非常 适合 于 图 像 归档 以 及 图 像 的 批 处 理 任务 。 可 以 使 用 PIL 创建 
缩 略 图 ， 转 换 图 像 格 式 ， 打 印 图 像 等 。 

(2) 图 像 展示 (Image Display)。PIL 较 新 的 版 本 支持 包括 Tk PhotoImage、BitmapImage 还 有 Windows 
DIB 等 接口 。PIL 支持 众多 的 GUI 框架 接口 ， 可 以 用 于 图 像 展示 。 

(3) 图 像 处 理 (Image Processing)。PIL 包括 基础 的 图 像 处 理 函 数 ， 包 括 对 点 的 处 理 ， 使 用 众多 的 卷 积 
核 做 过 滤 ， 还 有 颜色 空间 的 转换 。PIL 库 同 样 支持 图 像 的 大 小 转换 ， 图 像 旋转 ， 以 及 任意 的 仿 射 变换 。PIL 
还 有 一 些 直方 图 的 方法 ， 人 允许 展示 图 像 的 一 些 统计 特性 ， 可 以 用 来 实现 图 像 的 自动 对 比 度 增强 ， 以 及 全 局 
的 统计 分 析 等 。 

Image 类 是 PIL 中 的 核心 类 ， 可 以 有 很 多 种 方式 来 对 它 进 行 初始 化 ， 例 如 从 文件 中 加 载 一 张 图 像 ， 处 
理 其 他 形式 的 图 像 ， 或 者 是 新 建 一 张 新 图 像 等 。 下 面 是 PIL Image 类 中 常用 的 方法 。 

(1) open(filename,mode): 打开 一 张 图 像 。 下 面 给 出 一 点 儿 实例 ， 具 体 代码 如 下 。 

>>> from PIL import Image 

>>> Image.open("dog.jpg", "r") 

<PIL.JpegImagePlugin.JpegImageFile image mode=RGB 

size=296x299 at 0x7F62BDB5BOFO0> 

>>> im = Image.open("dog.jpg","r") 

>>> print (im.size, im.format, im.mode) 

(296, 299) JPEG RGB 


Image.open 返回 一 个 Image 对 象 ， 该 对 象 有 size、format、mode 等 属性 。 其 中 ，size 表示 图 像 的 宽度 和 
高 度 〈 用 像素 表示 );， format 表示 图 像 的 格式 ， 常见 的 包括 JPEG、PNG 等 格式 ，mode 表示 图 像 的 模式 ， 定 
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义 了 像素 类 型 及 图 像 深度 等 ， 常 见 的 有 RGB、HSV 等 。 一 般 来 说 ，L 表示 灰 度 图 像 ，RGB 表示 真 彩 图 像 ， 
CMYK 表示 预先 压缩 的 图 像 。 一 旦 得 到 了 打开 的 Image 对 象 之 后 ， 便 可 以 使 用 其 众多 的 方法 对 图 像 进 行 处 
理 了 ， 例 如 使 用 im.show0 可 以 展示 上 面 得 到 的 图 像 。 

(2) save(filename.format): 保存 指定 格式 的 图 像 。 

>>> im.save ("dog.png", "png') 这 段 代码 将 图 像 重 新 保存 成 png 格式 。 

(3) thumbnail(size,resample): 创建 缩 略图 。 


>>> im.thumbnail((50,50),resample=Image.BICUBIC) 
>>> im.show() 


以 上 代码 可 以 创建 一 个 指定 大 小 〈size) 的 缩 略 图 。 需 要 注意 的 是 ，thumbnail 方法 是 原 地 操作 ， 返 
值 是 None。 第 一 个 参数 是 指定 缩 略 图 的 大 小 ; 第 二 个 是 采样 的 ， 有 Image.BICUBIC、 PIL.Image.LANCZOS、 
PIL.Image.BILINEAR、PIL.ImageNEAREST 这 四 种 采样 方法 ， 默 认 是 Image.BICUBIC。 

(4) crop(box): 裁剪 矩形 区 域 。 


>>> im = Image.open("dog.jpg"，v"r") 
>>> box = (100,100,200,200) 

>>> region = im.crop (box) 

>>> Fegion.show() 

im.crop() 


以 上 代码 在 im 图 像 上 裁剪 了 一 个 box 和 矩形 区 域 ， 然 后 显示 出 来 。box 是 一 个 有 四 个 数字 的 元 组 
(upper_left x,upper_left y,lower right _x,lower right y)， 它 们 分 别 表示 裁剪 矩形 区 域 的 左上 角 (xy) 坐标 ， 
右 下 角 的 (x,y) 坐标 ， 规 定 图 像 的 最 左上 角 的 坐标 为 原点 (0,0)， 宽 度 的 方向 为 x 轴 ， 高 度 的 方向 为 y 轴 ， 
每 一 个 像素 代表 一 个 坐标 单位 。crop0 返 回 的 仍然 是 一 个 Image 对 象 。 

(5) transpose(method): 图 像 翻转 或 者 旋转 。 


>>> im rotate 180 = im.transpose (Image.ROTRTE 180) 
>>> im rotate 180.show!() 


以 上 代码 将 im 逆 时 针 旋转 180”， 然 后 显示 出 来 ，method 是 transpose 的 参数 ， 表 示 选 择 什 么 样 的 翻 
转 或 者 旋转 方式 ， 有 以 下 几 个 取 值 。 

Image.FLIP_LEFT_RIGHT: 表示 将 图 像 左右 翻转 

Image .FLIP_TOP_BOTTOM: 表示 将 图 像 上 下 翻转 

Image .ROTATE_90: 表示 将 图 像 逆 时 针 旋 转 90° 

Image.ROTRTE_180: 表示 将 图 像 逆 时 针 旋 转 180° 

Image .ROTATE_270: 表示 将 图 像 逆 时 针 旋 转 270° 

Image .TRANSPOSE: 表示 将 图 像 进行 转 置 (相当 于 顺 时 针 旋 转 90°) 

Image .TRANSVERSE: 表示 将 图 像 进行 转 置 ,再 水 平 翻转 

(6) paste(region,box,mask): 将 一 个 图 像 粘贴 到 另 一 个 图 像 。 


>>> im.paste (region, (100,100) ,None) 
>>> im.show() 


以 上 代码 将 region 图 像 粘贴 到 左上 角 为 (100,100〉 的 位 置 。region 是 要 粘贴 的 Image 对 象 ，box 是 要 
粘贴 的 位 置 ， 可 以 是 一 个 两 个 元 素 的 元 组 ， 表 示 粘 贴 区 域 的 左上 角 坐 标 ， 也 可 以 是 一 个 四 个 元 素 的 元 组 ， 
表示 左上 角 和 右 下 角 的 坐标 。 如 果 是 四 个 元 素 元 组 ，box 的 size 必须 要 和 region 的 size 保持 一 致 ， 否 则 将 
会 被 转换 成 和 region 一 样 的 size。 

(7) split0: 颜色 通道 分 离 。 

>>> Tvgrb = im.split() 


>>> r.show() 
>>> g.show() 


器 
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>>> b-show() 

split0 方 法 可 以 将 原来 图 像 的 各 个 通道 分 离 , 例如 对 于 RGB 图 像 ， 可 以 将 
(8) merge(mode,channels): 颜色 通道 合并 。 

>>> im merge = Image.merge ("RGB", [b,r,g]) 

>>> im merge.show() 


merge 方法 和 split 方法 是 相对 的 ， 其 将 多 个 单一 通道 的 序列 合并 起 来 ， 组 成 一 个 多 通道 的 图 像 。mode 
合并 之 后 图 像 的 模式 ， 例 如 RGB: channels 是 多 个 单一 通道 组 成 的 序列 。 
(9) resize(size,resample,box): 将 原始 的 图 像 转换 大 小 。 


>>> im resize = im.resize((200,200)) 


1 


R.G.B 三 个 颜色 通道 分 离 。 


>>> im resize 

<PIL. Image. Image image mode=RGB size=200x200 at 0x7F62B9E23470> 
>>> im resize.show() 

>>> im resize box = im.resize((100,100),box = (0,0,50,50)) 

>>> im resize box.show() 


size 是 转换 之 后 的 大 小 ; resample 是 重新 采样 使 用 的 方法 ,仍然 有 Image.BICUBIC、PIL.Image.LANCZOS、 


PIL.Image.BILINEAR、PIL.Image.NEAREST 这 四 种 采样 方法 ， 默 认 是 PIL.Image.NEAREST; box 是 指定 的 


要 


换 
为 


器 


resize 的 图 像 区 域 ， 是 一 个 用 四 个 元 组 指定 的 区 域 (含义 和 上 面 所 述 box 一 致 )。 
(10) convert(mode,matrix,dither,palette,colors): mode 转换 。 


>>> im L = im.convert("L") 

>>> im L.show() 

>>> im rgb = im L.convert ("RGB") 
>>> im rgb.show!() 

>>> im L.mode 


>>> im rgb.mode 
'RGB' 


convert 方法 可 以 改变 图 像 的 mode， 一 般 是 在 RGB( 真 彩 图 )、L( 灰 度 图 )、CMYK (压缩 图 ) 之 间 转 
。 上 面 的 代码 就 是 首先 将 图 像 转换 为 灰 度 图 ， 再 从 灰 度 图 转换 为 真 彩 图 。 值 得 注意 的 是 ， 从 灰 度 图 转换 
真 彩 图 ， 虽 然 理 论 上 确实 转换 成 功 了 ， 但 是 实际 上 是 很 难 恢复 成 原来 的 真 彩 模式 〈 不 唯一 )。 

(11)filter(filter): 应 用 过 滤器 。 

>>> im = Image.open("dog.jpg","r") 

>>> from PIL import ImageFilter 

>>> im blur = im.filter (ImageFilter.BLUR) 


>>> im blur.show() 

>>> im find edges = im.filter(ImageFilter.FIND EDGES) 
>>> im find edges.show() 

>>> im find edges.save ("find edges.jpg") 

>>> im blur.save ("blur.jpg") 


filter 方法 可 以 将 一 些 过 滤器 操作 应 用 于 原始 图 像 ， 例 如 模糊 操作 ， 查 找 边 、 角 点 操作 等 。filter 是 过 滤 
函数 ， 在 PIL.ImageFilter 函数 中 定义 了 大 量 内 置 的 filter0 函 数 ， 例 如 BLUR (模糊 操作 )、GaussianBlur 


(高 斯 模糊 )、MedianFilter〈 中 值 过 滤器 )、FIND_EDGES (查找 边 ) 等 。 


(12) point(lutmode): 对 图 像 像 素 进行 操作 。 
>>> im point = im.point (lambda x:x*1.5) 
>>> im _ point.show() 
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>>> im point.save("im point.jpg") 


point 方法 可 以 对 图 像 进行 单个 像素 的 操作 ， 上 面 的 代码 对 point 方法 传 入 了 一 个 匿名 函数 ， 表 示 将 


像 的 每 个 像素 点 大 小 都 乘 以 1.5。mode 是 返回 的 图 像 的 模式 ， 默 认 是 和 原来 图 像 的 mode 一 样 的 。 


9.6.2 ”字符 画 绘制 


| 


字符 画 是 一 系列 字符 的 组 合 ， 可 以 把 字符 看 作 比 较 大 块 的 像素 ， 将 一 个 字符 替换 成 一 块 颜色 ， 字 符 的 
种 类 越 多 ， 可 以 表现 的 颜色 也 越 多 ， 图 片 也 会 更 有 层次 感 。 
如 果 需 要 转换 一 张 彩色 的 图 片 ， 这 么 多 的 颜色 ， 要 怎么 对 应 到 单 色 的 字符 画 上 去 ? 这 便 引出 一 个 灰 度 


值 的 概念 。 


灰 度 值 ， 指 黑白 图 像 中 点 的 颜色 深度 ， 范 围 一 般 为 0 一 255， 白 色 为 255， 黑 色 为 0， 故 黑白 图 片 也 称 


为 灰 度 图 像 。 


可 以 使 用 灰 度 值 公 式 将 像素 的 RGB 值 映射 到 灰 度 值 : 
gray 一 0.2126 * r + 0.7152 * g + 0.0722 * b 


这 里 给 出 一 个 字符 画 绘制 实例 ， 具 体 代码 如 下 。 


import argparse 


from PIL import Image # 导 入 图 像 库 
parser = argparse.ArgumentParser () ## 命 令 行 输入 参数 处 理 
parser.add argument ('file') # 输 入 文件 
parser.add argument ('-o', '--output') # 输 出 文件 
parser.add argument ('--width', type = int, default = 80) # 输 出 字符 画 宽 
parser.add argument ('--height', type = int, default = 80) +# 输 出 字符 画 高 


+ 获取 参数 

args = parser.parse args() 
IMG = args.file 

WIDTH = args.width 

HEIGHT = args.height 
OUTPUT = args.output 


#4 定义 一 个 ASCII 的 列表 ,其 实 就 是 让 图 片上 的 灰 度 与 字符 对 应 
ascii_ char = list("$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\| ()1{}[]?-_+~ <>i!llI?:,\"^ '. ") 


# 将 256 灰 度 映 射 到 70 个 字符 上 


def get_char(r,g,b,alpha = 256) : ”4 这 个 调用 跟 im.getpixel 函数 有 关 , 这 个 函数 是 根据 图 片 的 横 纵 坐标 ,把 图 
片 解析 成 了 ,gbyalpha ( 灰 度 ) 有 关 的 四 个 参数 ,所 以 这 里 输入 参数 是 四 个 


if alpha = 0: # 如 果 灰 度 是 0, 说 明 这 里 没有 图 片 
Tretorn 
length = len(ascii char) # 计 算 这 些 字符 的 长 度 
gray = int(0.2126 * r + 0.7152 * g + 0.0722 * b) # 把 图 片 的 RGB 值 转换 成 灰 度 值 
unit = (256.0 + 1)/length #257/length 
return ascii char[int (gray/unit)] # 这 相当 于 选 出 了 灰 度 与 哪个 字符 对 应 
if _name =="' main ': # 如 果 是 本 程序 调用 , 则 执行 以 下 程序 
im = Image.open (IMG) # 打 开 图 片 
im = im.resize( (WIDTH, HEIGHT), Image.NEAREST) # 更 改 图 片 的 显示 比例 
Er #txt 初始 值 为 空 
for i in range (HEIGHT) : #i 代表 纵 坐 标 
for j in range (WIDTH): #j 代表 模 坐 标 


txt += get char (*im.getpixel((j,i))) 
# 把 图 片 按照 横 纵 坐标 解析 成 >, gb 以 及 alpha 这 几 个 参数 ,然后 调用 get_char 函数 ,把 对 应 的 图 片 转换 成 灰 度 值 ,把 对 应 什 
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的 字符 存 入 txt 中 

txt += '\n' # 每 行 的 结尾 处 ， 自动 换行 
print (txt) # 在 界面 打印 txt 文件 
# 字 符 画 输出 到 文件 
if OUTPUT: 

with open (OUTPUT，'w') as f: 下 文件 输出 

f.write (txt) 

else: 

with open("output.txt", 'w') as f: # 文 件 输出 


f.write (txt) 


9.7 ”就 业 面 试 技巧 与 解析 


数据 是 将 抽象 事物 实体 化 的 一 个 过 程 ， 任 何 一 门 计算 机 语言 都 需要 将 现实 事物 抽象 为 具体 的 数据 ， 
此 数据 处 理 在 Python 语言 中 非常 重要 。 合 理 地 存放 数据 可 以 优化 程序 执行 效率 ， 因 此 数据 格式 也 是 面试 中 
必 考 题目 之 一 。 读 者 应 从 Python 中 都 有 哪些 格式 化 数据 入 手 ， 它 们 之 间 有 什么 优 劣 关系 熟悉 这 些 足 以 应 
对 面试 。 


9.7.1 ”面试 技巧 与 解析 (一) 


面试 官 : JSON 序列 化 时 ， 可 以 处 理 的 数据 类 型 有 哪些 ? 
应 聘 者 : 可 以 处 理 的 数据 类 型 是 string、int、list、tuple、dict、bool、null。 


9.7.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : Python 字典 和 JSON 字符 串 相互 转换 的 方法 是 什么 ? 
应 聘 者 : 

4#json.dumps () 字典 转 JSON 字符 串 ,json .loads () JSON 转 字 典 
import json 

dic = {"name":"zs"} 

res = json.dumps (dic) 

print (res,type (res)) 

ret = json.loads (res) 

print (ret, type (ret)) 


{"name": "zs"} <class 'str'> 
{'name': 'zs'} <class 'dict'> 
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第 10 章 
Python 类 的 使 用 


E> 学 习 指引 


Python 从 设计 之 初 就 已 经 是 一 门面 向 对 象 的 语言 ， 正 因为 如 此 ， 在 Python 中 创建 一 个 类 和 对 象 是 很 容 
易 的 。 本 章 将 详细 介绍 Python 的 面向 对 象 编程 。 


二 ”重点 导读 


。 了 解 面向 对 象 。 

。 掌 握 Python 中 类 的 使 用 。 
。 掌 握 Python 类 的 继承 。 

。 进 行 Python 实战 。 


10.1 面向 对 象 


面向 对 象 编程 (Object Oriented Programming，OOP) 是 一 种 编程 范例 ， 它 提供 了 一 种 结构 化 程序 的 方 
法 ， 以 便 将 属性 和 行为 捆绑 到 单个 对 象 中 。 

例如 ， 对 象 可 以 具有 姓名 、 年 龄 、 地 址 等 属性 ， 具 有 行走 、 说 话 、 呼 吸 和 跑步 等 行为 或 者 包含 收 件 
人 列表 、 主 题 、 正 文 等 属性 ， 以 及 添加 附件 和 发 送 等 行为 。 


10.2 Python 基本 类 的 创建 


Python 中 同样 使 用 关键 字 class 创建 一 个 类 ， 类 名 称 第 一 个 字母 大 写 ， 可 以 带 括号 ， 也 可 以 不 带 括号 。 
Python 中 实例 化 类 不 需要 使 用 关键 字 new (也 没有 这 个 关键 字 )， 类 的 实例 化 类 似 函 数 调用 方式 。 


“10.2.1 初 识 
【 例 10-1】 代 码 如 下 。 


第 项 章 “Python 类 的 使 用 


## 定 义 函 数 的 方式 
class Dog: 

pass 
定义 一 个 类 的 格式 : 
+ 定义 类 的 方式 


class 类 名 : 
' 类 的 文档 字符 囊 ， 
类 体 


【 例 10-2】 代 码 如 下 。 
# 创 建 一 个 类 


class Data: 
Pass 


# 定 义 函数 的 属性 
class Rnimal: 去 定义 一 个 动物 类 
role = "animal' # 角 色 属 性 都 是 动物 〔 类 的 静态 属性 ) 
def run(self) : # 动 物 都 可 以 跑 ,也 就 是 有 一 个 跑 的 方法 ,也 叫 动态 属性 


print ("animal is walking...") 


10.2.2 属性 的 引用 


接 下 来 用 一 个 动物 类 和 一 个 人 的 类 来 描述 如 何 使 用 类 的 属性 。 
【 例 10-3】 用 一 个 动物 类 来 描述 如 何 使 用 类 的 属性 。 


# 定 义 函数 的 属性 
class Rnimal: # 定 义 一 个 动物 类 
role = "animal' + 角色 属性 都 是 动物 〔 类 的 静态 属性 7 
def run (self) : 动物 都 可 以 跑 ,也 就 是 有 一 个 跑 的 方法 ,也 叫 动 态 属性 


Print("animal is walking...") 
print (Animal.role) # 查 看 动物 的 role 属性 
print (Animal.run) # 引 用 动物 的 run 方法 , 注意 , 这 里 不 是 在 调用 
程序 运行 结果 如 图 10-1 所 示 。 


10-1 属性 的 使 用 


【 例 10-4】 用 一 个 人 类 来 描述 如 何 使 用 类 的 属性 。 


class Person: # 定 义 一 个 人 类 
role = 'person' # 角 色 属 性 都 是 人 
def _ init (self,name): 


self.name = name 。 + 每 一 个 角色 都 有 自己 的 昵称 


def walk(self) : 站 人 都 可 以 走路 ,也 就 是 有 一 个 走路 方法 
print ("person is walking...") 
print (Person.role) # 查 看 人 的 role 属性 
print (Person.walk) 二 引 用 人 的 walk 方法 ,注意 , 这 里 不 是 在 调用 
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程序 运行 结果 如 图 10-2 所 示 。 


10-2 属性 的 使 用 


所 有 类 都 创建 对 象 ， 所 有 对 象 都 包含 称 为 属性 的 特征 〈 在 开头 段落 中 称 为 属性 )。 使 用 _init _ 0 方法 
通过 为 对 象 的 初始 属性 提供 其 默认 值 〈 或 状态 ) 来 初始 化 对 象 的 初始 属性 。 
| 


410.2.3 关于 self 


self 在 实例 化 时 自动 将 对 象 /实例 本 身 传 给 ”init 的 第 一 个 参数 ， 也 可 以 给 它 起 个 别 的 名 字 ， 但 是 一 般 
都 不 会 这 么 做 。 
| 


4 10.2.4 ”类 属性 补充 


类 的 属性 有 两 种 查看 方式 。 

(1) dir (类 名 ): 查 出 的 是 一 个 名 字 列表 。 

(2) 类 名 .dict_: 查 出 的 是 一 个 字典 ，key 为 属性 名 ，value 为 属性 值 。 
以 下 为 一 些 特殊 的 类 属性 。 

类 名 name_# 类 的 名 字 (字符 串 ) 

类 名 .doc_# 类 的 文档 字符 串 

类 名 .base_# 类 的 第 一 个 父 类 〈 在 介绍 继承 时 会 讲 7 

类 名 ._ bases_# 类 所 有 父 类 构成 的 元 组 (在 介绍 继承 时 会 讲 ) 
类 名 ._ dict_# 类 的 字典 属性 

类 名 .module _# 类 定义 所 在 的 模块 

类 名 ._class_# 实 例 对 应 的 类 〔 仅 在 新 式 类 中 ) 


10.3” ”Python 类 的 继承 的 组 合 


继承 是 一 个 类 接受 另 一 个 类 的 属性 和 方法 的 过 程 。 新 形成 的 类 称 为 子 类 ， 子 类 派生 的 类 称 为 父 类 。 

重要 的 是 要 注意 子 类 覆盖 或 扩展 父 类 的 功能 (例如 ， 属 性 和 行为 )。 换 句 话 说 ， 子 类 继承 了 父 类 的 所 
有 属性 和 行为 ， 但 也 可 以 指定 要 遵循 的 不 同行 为 。 最 基本 的 类 是 一 个 对 象 ， 通 常 所 有 其 他 类 都 作为 父 对 
象 继承 。 

定义 新 类 时 ，Python 3 隐 式 使 用 object 作为 父 类 。 


10.3.1 单 继承 


编写 类 时 ， 并 非 总 是 要 从 空白 开始 。 如 果 要 编写 的 类 是 另 一 个 现成 类 的 特殊 版 本 ， 可 使 用 继承 。 一 个 
类 继承 另 一 个 类 时 ， 它 将 自动 获取 另 一 个 类 的 所 有 属性 和 方法 ， 原 有 的 类 称 为 父 类 〈 基 类 )， 而 新 类 称 为 子 
类 (派生 类 )。 子 类 继承 了 父 类 的 所 有 属性 和 方法 ， 同 时 还 可 以 定义 自己 的 属性 和 方法 。 

继承 的 意义 : 重用 代码 ， 方 便 代 码 的 管理 和 修改 。 
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【 例 10-5】 代 码 如 下 。 
## 类 定义 


class people: 

# 定 义 基 本 属性 

name = 1 

sex = 0 

# 定 义 私有 属性 ,私有 属性 在 类 外 部 无 法 直接 进行 访问 

_height = 0 

# 定 义 构造 方法 

def _init (self, n, a, Ww): 
self.name = n 
self.sex = a 
Self. height =W 


def speak(self): 
print ("%s 说 : 我 的 性 别 是 $s 。" $ (self.name, self.sex)) 
# 单 继承 实例 
class son (People) : # 在 括号 中 写 父 类 名 
grade = "1 
def _ init (self, n, a, Ww, 9g) : 
# 调 用 父 类 的 构造 函数 
people. init (self, n, a, Ww) 
self.grade = 9 
# 覆 写 父 类 的 方法 
def speak(self): 
print ("%s 说 :我 的 性 别 是 %$s。, 我 在 读 %d 年 级 ”$ (self.name, self.sex, self.grade)) 
s = son(' 宋 宋 ',' 男 ', 12, 6) 
5.speak() 


程序 运行 结果 如 图 10-3 所 示 。 


图 10-3 单 继承 的 使 用 


从 上 述 例子 可 以 看 出 什么 是 重 写 。son 继承 了 people 这 个 类 ， 同 时 拥有 了 和 父 类 同样 的 函数 ， 那 么 调 
用 子 类 的 这 个 函数 时 会 覆盖 掉 父 类 的 函数 。 这 个 过 程 就 叫 作 重 写 。 

创建 子 类 的 实例 时 , Python 首先 需要 完成 的 任务 是 给 父 类 的 所 有 属性 赋值 。 为 此 , 子 类 的 方法 _init 0 
需要 父 类 施 以 援手 。 

【 例 10-6】 代 码 如 下 。 


class Rectangle (object): 
def _ init (self, width, length): 专 实例 化 传 参 时 将 初始 化 参数 
self.width = width 
self.length = length 
def get_area(self) : 
return self.width * self.length 
class Square (Rectangle) : 
def _init (self, width, length): 
if width == length: 
Rectangle. init (self, width, length) 给 此 处 调用 了 父 类 方法 ,这 里 的 self 是 正方 形 的 实例 ， 
不 是 矩形 的 实例 
else: 
print (" 长 度 和 宽度 不 相等 ,不 能 成 为 正方 形 ') 
square = Square(25，25) 
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square.get area() 
squarel = Square(25，22) 


程序 运行 结果 如 图 10-4 所 示 。 


10.3.2 super() 函 数 图 10-4， 单 继承 的 使 用 


使 用 super0 函 数 ， 可 以 访问 已 在 类 对 象 中 覆盖 的 继承 方法 。 

当 使 用 super0 函 数 时 ， 将 一 个 父 方法 调用 到 子 方法 中 以 使 用 它 。 例 如 ， 我 们 可 能 希望 使 用 某 些 功 能 
盖 父 方法 的 一 个 方面 ， 然 后 调用 原始 父 方法 的 其 余部 分 来 完成 该 方 

super(O 函 数 最 常用 于 _init “0 方法， 因此 在 那里 很 可 能 需要 为 子 类 添加 一 些 唯一 性 ， 然 后 在 父 类 完成 
初始 化 。 

【 例 10-7】 代 码 如 下 。 


class Person(object) : 
def _init (self,name): 
self.name = name 
def getname (self): 
Print (self.name) 


cd 


class student (Person): 
def _init (self,name,age): 
#Person. init (self,name) 
super (Student, self)._ init (name) 
self.age = age 


5 = Student('wyj2',18) 
s.getname () 


关 拓 本 灵 相 刁 直 椒 避 业 央 髓 证 民 骨 由 并 骨 柑 邮 骨 扩 内 骨 红 骨 几 纵 骨 几 失 骨 失 髓 迷失 内 好 内 具 


class Person: 
def _ init_ (self,name): 
self.name = name 
def getname (self): 
Print (self.name) 


class student (Person): 
def _init (self,name,age): 
Person._ init (self,name) 
self.age = age 


5 = Student('wyj',18) 


ne | 


pp .5 所 示 
程序 运行 结果 如 图 10-5 所 示 。 10-5 super() 的 使 用 


10.3.3 ”多 继承 


一 个 子 类 可 以 继承 多 个 父 类 称 作 多 继承 。 

一 层 层 继承 下 去 是 多 重 继承 。 

与 C++ 一样， 一 个 类 可 以 从 Python 中 的 多 个 基 类 派生 ， 这 称 为 多 重 继承 。 
在 多 继承 中 ， 所 有 基 类 的 特性 都 继承 到 派生 类 中 。 多 继承 的 语法 类 似 于 单 继承 。 


HH 
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【 例 10-8】 代 码 如 下 。 
class Basel: 


pass 


class Base2: 
pass 


class MultiDerived (Basel, Base2): 

pass 
这 样 就 实现 了 MultiDerived 继承 了 basel，base2。 
另 一 方面 ， 也 可 以 继承 形式 派生 类 ， 这 称 为 多 级 继承 。 它 可 以 是 Python 中 的 任何 深度 。 
在 多 级 继承 中 ， 基 类 和 派生 类 的 特性 将 继承 到 新 的 派生 类 中 。 
【 例 10-9】 代 码 如 下 。 


class Base: 
pass 


class Derivedl (Base) : 
pass 


class Derived2 (Derived1): 
pass 
Python 中 的 每 个 类 都 派生 自 类 对 象 ， 它 是 Python 中 最 基本 的 类 型 。 
从 技术 上 讲 ， 所 有 其 他 类 (内置 或 用 户 定义 ) 都 是 派生 类 ， 所 有 对 象 都 是 对 象 类 的 实例 。 
在 多 继承 方案 中 ， 首 先 在 当前 类 中 搜索 任何 指定 的 属性 。 如 果 未 找到 ， 则 搜索 将 以 深度 优先 、 左 右 方 
式 继续 进入 父 类 ， 而 不 会 两 次 搜索 同一 个 类 。 
【 例 10-10】 代 码 如 下 。 
class R(object) : 
pass 
class B(A): 
pass 
class C(A): 
pass 
class D(B) : 
pass 
class E(B): 
pass 
class F(D,E): 
pass 


# 广 度 优先 搜索 


print(F. mro_ ) 
程序 运行 结果 如 图 10-6 所 示 。 
图 10-6 多 继承 的 使 用 
通过 执行 结果 可 以 明确 地 看 出 多 层 继承 的 搜索 方式 是 广度 优先 搜索 。 


10.3.4 组 合 


除了 使 用 继承 之 外 还 可 以 使 用 Python 的 组 合 方式 。 
当 类 之 间 有 显著 的 不 同 ， 并 且 较 小 的 类 是 组 成 较 大 类 所 需要 的 组 件 时 ， 用 类 的 组 合 较 合理 。 
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例如 ， 医 院 是 由 多 个 科室 组 成 的 ， 此 时 可 以 定义 不 同 科室 的 类 ， 这 样 医院 的 类 就 可 以 直接 使 用 各 个 不 
同 科室 的 类 进行 组 合 。 

组 合 就 是 说 一 个 类 中 把 另 一 个 类 当成 属性 去 使 用 。 

【 例 10-11】 代 码 如 下 。 


class knife: 


def prick(self,obj): 才 刀 可 以 刺 伤 别人 
obj -= 500 ## 刀 拥有 这 么 多 的 攻击 力 
Print (obj) 

class Person: # 定 义 一 个 人 类 

role = "person' 志 角 色 属 性 都 是 人 

def _init (self, name): 
self.name = name # 每 一 个 人 都 有 自己 的 名 字 
self.knife= knife() # 给 人 一 把 刀 


egg = Person('egon') 


obj = 1000 
程序 运行 结果 如 图 10-7 所 示 。 图 10-7 组 合 的 使 用 


上 述 例子 就 是 实现 了 在 人 的 对 象 中 使 用 刀子 的 方法 。 


10.4 ”Python 之 抽象 


1. 什么 是 抽象 类 

与 Java 一 样 ，Python 也 有 抽象 类 的 概念 ， 但 是 同样 需要 借助 模块 实现 。 抽 象 类 是 一 种 特殊 的 类 ， 它 的 
特殊 之 处 在 于 只 能 被 继承 ， 不 能 被 实例 化 。 

2. 为 什么 要 有 抽象 类 

如 果 说 类 是 从 一 堆 对 象 中 抽取 相同 的 内 容 而 来 的 , 那么 抽象 类 就 是 从 一 堆 类 中 抽取 相同 的 内 容 而 来 的 ， 
内 容 包 括 数据 属性 和 函数 属性 。 

例如 有 香 葵 的 类 ， 有 苹果 的 类 ， 有 桃子 的 类 ， 从 这 些 类 抽取 相同 的 内 容 就 是 水 果 这 个 抽象 的 类 。 吃 水 果 时 
要 么 是 吃 一 个 具体 的 香 蔡 ， 要 么 是 吃 一 个 具体 的 桃子 ，…… 永远 无 法 吃 到 一 个 叫 作 水 果 的 东西 。 

从 设计 角度 去 看 ， 如 果 类 是 从 现实 对 象 抽象 而 来 的 ， 那 么 抽象 类 就 是 基于 类 抽象 而 来 的 。 

从 实现 角度 来 看 ， 抽 象 类 与 普通 类 的 不 同 之 处 在 于 : 抽象 类 中 只 能 有 抽象 方法 〈 没 有 实现 功能 )， 该 类 
不 能 被 实例 化 ， 只 能 被 继承 ， 且 子 类 必须 实现 抽象 方法 。 这 一 点 与 接口 有 点 儿 类 似 ， 但 其 实 是 不 同 的， 后 
面 即将 揭晓 答案 。 

3. 在 Python 中 实现 抽象 类 

【 例 10-12】 代 码 如 下 。 


# 一 切 曾 文件 
import abc # 利 用 abc 模块 实现 抽象 类 


class All file (metaclass=abc.ABCMeta): 
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all _ type='file' 
abc.abstractmethod 
def read(self) : 

" 子 类 必须 定义 读 功能 ， 

pass 
@abc.abstractmethod 
def write(self) : 

" 子 类 必须 定义 写 功能 ， 


pass 


# class Txt (All file): 


#4 pass 
# 
# tl=Txt () 


class Txt (All file): 
def read(self): 


4 定义 抽象 方法 ,无 须 实现 功能 


# 定 义 抽象 方法 ,无 须 实现 功能 


# 报 错 , 子 类 没有 定义 抽象 方法 


# 子 类 继承 抽象 类 ,但 是 必须 定义 read 和 write 方法 


print (' 文 本 数据 的 读 取 方法 ') 


def write(self) : 


Print (' 文 本 数据 的 读 取 方法 ') 


class Satal(All file): 
def read(self): 


# 子 类 继承 抽象 类 ,但 是 必须 定义 read 和 write 方法 


print (' 硬 盘 数据 的 读 取 方法 ') 


def write(self) : 


print (" 硬 盘 数 据 的 读 取 方 法 ') 


class Process(All file): 
def read(self): 


# 子 类 继承 抽象 类 , 但 是 必须 定义 read 和 write 方法 


print (' 进 程 数据 的 读 取 方法 ') 


def write(self) : 


print (' 进 程 数据 的 读 取 方法 ') 


wenbenwenjian=Txt () 


yingpanwenjian=sata() 


jinchengwenjian=Process () 


# 这 样 大 家 都 是 被 归 一 化 了 ,也 就 是 一 切 曾 文件 的 思想 


wenbenwenjian.read() 
yingpanwenjian.write() 
jinchengwenjian.read() 


Print (wenbenwenjian.all type) 
print (yingpanwenjian.all type) 
print (jinchengwenjian.all type) 


程序 运行 结果 如 图 10-8 所 示 。 


4. 抽象 类 与 接口 


第 国 章 Python 类 的 使 用 


10-8 抽象 的 使 用 


抽象 类 本 质 上 还 是 类 ， 它 指 的 是 一 组 类 的 相似 性 ， 包 括 数据 属性 〈 如 all_ type) 和 函数 属性 〈 如 read、 
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write)， 而 接口 只 强调 函数 属性 的 相似 性 。 
抽象 类 是 一 个 介 于 类 和 接口 之 间 的 一 个 概念 , 同时 具备 类 和 接口 的 部 分 特性 , 可 以 用 来 实现 归 一 化 设计 。 


10.5 ”作业 与 实战 


上 文中 学 习 了 Python 3 对 于 类 的 基本 创建 、 继 承 以 及 多 继承 ， 接 下 来 就 来 练习 一 下 。 
【 例 10-13】 实现 一 个 银行 的 业务 流程 。 
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10.6 ”就 业 面试 技巧 与 解析 


了 Python 中 所 有 的 数据 都 是 对 象 ， 它 提供 了 许多 高 级 的 内 建 数据 类 型 ， 功 能 强大 ， 使 用 方便 ， 是 Python 
的 优点 之 一 ， 在 面试 中 ， 关 于 类 的 使 用 、 面 向 对 象 也 常常 作为 重点 ， 下 面 通过 两 个 练习 来 加 深 读者 对 类 的 
理解 。 


10.6.1 ”面试 技巧 与 解析 (一) 
面试 官 ， 以 下 代码 将 输出 什么 ? 
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应 聘 者 : 第 1 行 输出 111， 第 2 行 输出 121， 第 3 行 输出 323。 


10.6.2 面试 技巧 与 解析 〈 二 ) 
面试 官 : 以 下 代码 将 输出 什么 ? 


应 聘 者 : 第 1 行 输出 listl = [10]， 第 2 行 输出 listz = [123]， 第 3 行 输出 [a]。 
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二 ”学 习 指 引 


学 会 使 用 Python 模块 将 使 项 目 变 得 更 加 简洁 、 高 效 。 


二 ”重点 导读 


“ 了解 Python 模块 思想 。 
。 掌 握 Python 中 模块 的 基本 使 用 方法 。 
。 掌 握 Python 模块 的 多 种 使 用 方式 。 


11.1 “什么 是 模块 编程 


模块 化 编程 是 指 将 大 型 、 笨 拙 的 编程 任务 分 解 为 单独 的 、 更 小 更 易于 管理 的 子 任务 或 模块 的 过 程 。 然 
后 可 以 像 构建 块 一 样 拼凑 单个 模块 以 创建 更 大 的 应 用 程序 。 

在 大 型 应 用 程序 中 模块 化 代码 有 以 下 几 个 优点 。 

(1) 简单 性 : 模块 通常 只 关注 问题 的 一 小 部 分 ， 而 不 是 关注 手头 的 整个 问题 。 如 果 正 在 处 理 单个 模块 ， 
那么 将 有 一 个 较 小 的 问题 等 待 解决 。 这 使 得 开发 更 容易 ， 更 不 容易 出 错 。 

(2) 可 维护 性 : 模块 通常 设计 为 能 够 在 不 同 的 问题 域 之 间 实 施 逻 辑 边 界 。 如 果 以 最 小 化 相互 依赖 性 
的 方式 编写 模块 ， 则 对 单个 模块 的 修改 将 对 程序 的 其 他 部 分 产生 影响 的 可 能 性 降低 〈 甚 至 可 以 在 不 了 解 
该 模块 之 外 的 应 用 程序 的 情况 下 对 模块 进行 更 改 )。 这 使 得 许多 程序 团队 在 大 型 应 用 程序 上 协同 工作 更 加 
可 行 。 

(3) 可 重用 性 :单个 模块 中 定义 的 功能 可 以 通过 应 用 程序 的 其 他 部 分 轻松 地 重用 (通过 适当 定义 的 界 
面 )。 这 消除 了 重新 创建 重复 代码 的 需要 。 

(4) 范围 : 模块 通常 定义 一 个 单独 的 命名 空间 ， 这 有 助 于 避免 程序 的 不 同 区域 中 的 标识 符 之 间 的 


冲突 


函数 、 模 块 和 包 都 是 Python 中 用 于 促进 代码 模块 化 的 构造 。 
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11.2 “Python 模块 的 基本 使 用 


了 解 了 什么 是 模块 编程 ， 一 定 迫 不 及 待 地 想 知道 如 何 去 使 用 吧 ? 下 面 先 通过 一 个 小 例子 来 简单 地 认识 
一 下 Python 的 基本 使 用 。 


11.2.1 ” 初 识 模块 


模块 可 以 用 Python 本 身 编写 , 也 可 以 用 C 编写 并 在 运行 时 动态 加 载 , 就 像 re (正则 表达 式 ) 模块 一 样 。 
内 置 模块 本 质 上 包含 在 解释 器 中 ， 就 像 itertools 模块 一 样 。 在 所 有 三 种 情况 下 ， 模 块 的 内 容 都 以 相同 的 方 
式 访 问 : 使 用 import 语句 。 

在 这 里 , 重点 主要 放 在 用 Python 编写 的 模块 上 。 使 用 Python 编写 的 模块 很 酷 , 它们 构建 起 来 非常 简单 ， 
需要 做 的 就 是 创建 一 个 包含 合法 Python 代码 的 文件 ， 然 后 为 该 文件 指定 一 个 扩展 名 为 .py 的 名 称 。 

【 例 11-1】 代 码 如 下 。 


// 我 们 将 这 段 代码 起 名 为 Mod .py 
B= “来 遇 1 
a= [100, 200, 300] 


def foo(arg) : 
print(f'arg = {arg}') 


class Foo: 
pass 


在 上 面 的 代码 中 定义 了 如 下 几 种 类 型 。 

5 (字符 串 类 型 ) 

a (列表 ) 

foo() (函数 ) 

Foo (类 ) 

接 下 来 换 一 种 写法 。 

【 例 11-2】 代 码 如 下 。 

>>> import mod 

>>> print (mod.s) 

来 师 ! . 

>>> mod.a 

[100, 200, 300] 

>>> mod.foo(['quux', 'corge', 'grault']) 

arg = ['quux', 'corge', 'grault'] 

>>> x = mod.Foo() 

>>> x 

根据 上 面 的 例子 继续 测试 一 下 。 

当 解 释 器 执行 上 面 的 import 语句 时 ， 它 会 从 以 下 源 汇编 的 目录 列表 中 搜索 mod.py。 

(1) 运行 输入 脚本 的 目录 ， 或 者 交互 式 运行 解释 器 的 当前 目录 。 

(2) PYTHONPATH 环境 变量 中 包含 的 目录 列表 (如 果 已 设置 )。(PYTHONPATH 的 格式 取决 于 操作 
系统 ， 但 应 模仿 PATH 环境 变量 。) 

(3) 安装 Python 时 配置 的 与 安装 相关 的 目录 列表 。 
生成 的 搜索 路 径 可 以 在 Python 变量 sys.path 中 访问 ， 该 变量 从 名 为 sys 的 模块 获得 。 
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【 例 11-3】 代 码 如 下 。 


import sys 
print (sys.path) 


程序 运行 结果 如 图 11-1 所 示 。 


UF: VianzhitestOl,. Fianzhitestol CNPrthoa\Python36\ioython36 zip'.C:\\Pythoa\python36 WnLLS | 
11-1 显示 路 径 
因此 ， 为 确保 找到 模块 ， 需 要 执行 以 下 操作 之 一 。 

将 mod.py 放 在 输入 脚本 所 在 的 目录 或 当前 目录 如果 是 交互 式 )， 在 启动 解释 器 之 前 ,修改 
PYTHONPATH 环境 变量 以 包含 mod.py 所 在 的 目录 ， 或 者 将 mod.py 放 在 PYTHONPATH 变量 中 已 包含 的 
中 一 个 目录 中 。 

将 mod.py 放 在 一 个 依赖 于 安装 的 目录 中 ， 也 有 可 能 没有 写 入 权限 ， 具 体 取决 于 操作 系统 。 
实际 上 还 有 一 个 选项 : 可 以 将 模块 文件 放 在 自己 选择 的 任何 目录 中 ， 然 后 在 运行 时 修改 sys.path， 使 其 
包含 该 目录 。 例 如 ， 在 这 种 情况 下 ， 可 以 将 mod.py 放 在 目录 C:\Usersjohn 中 ， 然 后 使 用 以 下 语句 。 

【 例 11-4】 代 码 如 下 。 

>>> sys.path.append(r'c:\Users\john') 

>>> sys.path 

['', 'C:\\Users\\john\\Documents\\Python\\doc', 'C:\\Python36\\Lib\\idlelib', 

'C:\\Python36\\python36.zip', 'C:\\Python36\\DLLs', 'C:\\Python36\\1ib', 

'C:\\Python36', 'C:\\Python36\\lib\\site-packages', 'C:\\Users\\john'] 

>>> import mod 

导入 模块 后 ， 可 以 使 用 模块 的 _file “属性 确定 找到 模块 的 位 置 。 

【 例 11-5】 代 码 如 下 。 


>>> import mod 


>>> mod. file 
'C:\\Users\\john\\mod.py’' 


>>> import re 
>>> re. file 
'C:\\Python36\\1ib\\re.py' 


_ file 的 目录 部 分 应 该 是 sys.path 中 的 目录 之 一 。 


$11.2.2 from…import 
Python 的 from 语句 允许 将 模块 中 的 特定 属性 导入 当前 命名 空间 。from…import 语法 如 下 。 


from modname import namel[, name2[, *… nameN]] 

例如 ， 要 从 模块 fib 导入 函数 fibonacci， 请 使 用 以 下 语句 : 

from fib import fibonacci 

此 语句 不 会 将 整个 模块 fib 导入 当前 名 称 空间 ; 它 只 是 将 模块 fib 中 的 项 目 fibonacci 引入 到 模块 的 全 局 
符号 表 。 

也 可 以 使 用 以 下 import 语句 将 模块 中 的 所 有 名 称 导入 当前 名 称 空间 。 

from modname import * 


通过 这 行 代码 就 可 以 将 其 他 模块 整个 加 载 进 去 (但 是 不 推荐 这 么 做 ， 会 影响 程序 的 速度 )。 
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11.3 ”模块 详细 使 用 


上 面 已 经 对 Python 模块 有 了 一 个 基本 的 了 解 ， 接 下 来 就 详细 地 介绍 一 下 Python 中 变量 、 命 名 空间 ,以 
及 函数 的 使 用 。 


11.3.1 ”变量 与 命名 空间 


变量 是 映射 到 对 象 的 名 称 〈 标 识 符 )。 命 名 空间 是 变量 名 称 〈 键 ) 及 其 对 应 的 对 象 〈 值 ) 的 字典 。 

了 Python 语句 可 以 访问 本 地 名 称 空间 和 全 局 名 称 空间 中 的 变量 。 如 果 局 部 变量 和 全 局 变量 具有 相同 的 名 
称 ， 则 局 部 变量 将 影响 全 局 变量 。 
每 个 函数 都 有 自己 的 本 地 命名 空间 。 类 方法 遵循 与 普通 函数 相同 的 范围 规则 。 
Python 对 变量 是 局 部 变量 还 是 全 局 变量 进行 了 有 根据 的 猜测 。 它 假定 在 函数 中 赋值 的 任何 变量 都 是 本 
地 的 。 
因此 ， 要 为 函数 中 的 全 局 变量 赋值 ， 必 须 首先 使 用 全 局 语句 。 
全 局 语句 告诉 Python VarName 是 一 个 全 局 变量 ，Python 将 停止 在 本 地 命名 空间 中 搜索 变量 。 
例如 ， 在 全 局 命名 空间 中 定义 变量 Money。 在 Money0 函 数 中 ， 为 Money 分 配 一 个 值 ， 因 此 Python 将 
Money 视 为 局 部 变量 。 但 是 , 我 们 在 设置 之 前 访问 了 局 部 变量 Money 的 值 , 因此 结果 是 UnboundLocalError。 
取消 注释 全 局 语句 可 以 解决 这 个 问题 。 

【 例 11-6】 代 码 如 下 。 


#!/usr/bin/python 


Money = 2000 

def AddMoney(): 
Money = Money + 1 

print Money 

AddMoney () 

print Money 


程序 运行 结果 如 图 11-2 所 示 。 


11-2 ”错误 结果 


11.3.2 dir() 函 数 


dir0 内 置 函数 返回 包含 模块 定义 的 名 称 的 字符 串 的 排序 列表 。 
该 列表 包含 模块 中 定义 的 所 有 模块 、 变 量 和 函数 的 名 称 。 以 下 是 一 个 简单 的 例子 。 
【 例 11-7】 代 码 如 


#!/usr/bin/python 


习 


#Import built-in module math 
import math 
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content = dir (math) 
print (content) 


程序 运行 结果 如 图 11-3 所 示 。 


图 11-3 部 分 执行 结果 
这 里 ， 特 殊 字符 串 变量 _name 是 模块 的 名 称 ，_ file 是 加 载 模块 的 文件 名 。 


globals() 和 locals() 函 数 


globals0 和 locals0 函 数 可 用 于 返回 全 局 和 本 地 名 称 空间 中 的 名 称 ， 具 体 取决 于 调用 它们 的 位 置 。 
如 果 从 函数 内 调用 locals0， 它 将 返回 可 从 该 函数 本 地 访问 的 所 有 名 称 。 

如 果 从 函数 内 调用 globals0， 它 将 返回 可 从 该 函数 全 局 访问 的 所 有 名 称 。 

这 两 个 函数 的 返回 类 型 是 字典 ， 因 此 ， 可 以 使 用 keys0 函 数 提取 名 称 。 


1.3.4 reloads() 函 数 


出 于 效率 的 原 个 解释 器 会 话 仅 加 载 一 次 模块 ， 这 对 于 函数 和 类 定义 来 说 很 好 。 这 通常 构成 了 模 
块 内 容 的 大 部 分 。 但 是 模块 也 可 以 包含 可 执行 语句 ， 通 常用 于 初始 化 。 请 注意 ， 这 些 语句 仅 在 第 一 次 导入 
模块 时 执行 。 

【 例 11-8】 代 码 如 下 。 

a= [100, 200, 300] 

print('a =', a) 

【 例 11-9】 代 码 如 下 。 

>>> import mod 

a= [100, 200, 300] 

>>> import mod 


>>> import mod 


>>> mod.a 

printO 语 句 不 会 在 后 续 导 入 中 执行 。( 就 此 而 言 ， 也 不 是 赋值 语句 ， 但 是 作为 mod.a 值 的 最 终 显示 ， 这 
并 不 重要 。 一 旦 完成 赋值 ， 它 就 会 坚持 。) 

如 果 对 模块 进行 了 更 改 并 需要 重新 加 载 它 , 则 需要 重新 启动 解释 器 或 使 用 模块 importlib 中 名 为 reloadO 
的 函数 。 

【 例 11-10】 代 码 如 下 。 


>>> import mod 
a = [100, 200, 300] 


>>> import mod 


>>> import importlib 

>>> importlib.reload (mod) 

a = [100, 200, 300] 

<module 'mod' from 'C:\\Users\\john\\Documents\\Python\\doc\\mod.py'> 
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11.4” 包 的 使 用 
本 节 主 要 讲解 第 三 方 包 的 导入 与 使 用 。 


11.4.1 包 的 简介 


假设 开发 了 一 个 包含 许多 模块 的 非常 大 的 应 用 程序 。 随 着 模块 数量 的 增加 ， 如 果 将 模块 转 储 到 一 个 位 置 ， 
就 很 难 跟踪 它们 。 如 果 它们 具有 相似 的 名 称 或 功能 ， 则 尤其 如 此 。 此 时 可 能 希望 采用 分 组 的 组 织 方法 。 

了 Python 人 允许 使 用 点 表示 法 对 模块 命名 空间 进行 分 层 结构 化 。 与 模块 有 助 于 避免 全 局 变量 名 之 间 冲 突 的 
方式 相同 ， 包 有 助 于 避免 模块 名 称 之 间 的 冲突 。 

创建 包 非 常 简单 ， 因 为 它 利 用 了 操作 系统 固有 的 分 层 文件 结构 。 考 虑 以 下 安排 这 里 有 一 个 名 为 pkg 
的 目录 ， 它 包含 两 个 模块 mod1.py 和 mod2.py. 模 块 的 内 容 如 下 所 示 。 

【 例 11-11】 代 码 如 下 。 


modl.py 


def foo0: 
print(' [mod1] fo000') 


class Foo: 
pass 


mod2.py 


def bar0: 
print(' [mod2] barO') 


class Bar: 
pass 


给 定 此 结构 ， 如 果 pkg 目录 位 于 可 以 找到 它 的 位 置 〈 在 sys.path 中 包含 的 某 个 目录 中 )， 则 可 以 使 用 点 
表示 法 (pkgmodl，pkgmod2) 引用 这 两 个 模块 。 


11.4.2 第 三 方 包 的 导入 与 使 用 


程序 中 不 会 仅 使 用 自己 写 的 包 ， 一 定 会 依赖 于 大 量 别人 开源 分 享 的 包 。 要 想 安 装 别 人 的 包 首 先 就 要 学 
会 使 用 PIP。 

1. 下 载 PIP 

官网 地 址 :https://pypi.org/project/pip/#downloads。 

下 载 地址 :https://files.pythonhosted.org/packages/ae/e8/2340d46ecadb1692ale455f13f75e596d4eab3d11a5 
7446f08259dee8f02/pip-10.0.1.tar.gz。 

pip-10.0.1.tar.gz 下 载 完毕 后 ， 解 压缩 。 

2. 在 Windows 上 使 用 "命令 提示 符 " 进入 PIP 解压 后 的 目录 

输入 如 下 命令 ， 如 图 11-4 所 示 。 

cd C:\Users\stsud\Downloads\pip-10.0.1 
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入 到 环境 变量 )。 


图 11-4 进入 解压 后 的 目录 
然后 使 用 python3 setup.py install 进行 安 


装 , 安装 完成 之 后 出 现 finished 说 明 安装 成 功 (Python 3 要 先 加 


(1) Python 3 加 入 到 环境 变量 的 方法 ， 如 图 11-5 所 示 。 


此 电脑 一 属性 一 高 级 系统 设置 一 环境 变量 


针 基 机 名 硬件 珊 妥 。 系 巡 保护 运 各 


进 行 大 多 数 更 改 ， 你 他 拓 作 管理 只 登录 . 站 
nt Reader\plugins\ 
rm 
视 宇 8 昌 ， 外 理 基 计 ,Bai 看 
RS) 
用 ~ 配置 文件 
与 各 妇 覆 户 碍 x 二 向 0 年 mm) ME) 
ms. Sr) 
ow 旭 信 外 
拓 换 避 动 、 基 S10 和 本 这 信息 


Er 


stsud 的 失 记 安 归 (U) 


path 


全 
NUMBER_OF_PROCESSORS 8 


PROCESSOR IDE 


图 11-5 加 入 环境 变量 
检查 Python 环境 变量 是 否 导入 成 功 ， 如 图 11-6 所 示 。 


图 11-6 检查 环境 变量 
然后 回 到 第 2 步 : 使 用 python3 setup.py install 进行 安装 ， 
(2) 如 果 执行 pip 命令 后 提示 找 不 到 这 个 命令 , 需要 将 PIP 的 安装 路径 加 入 到 环境 灾 量 中 ， 路 径 一 般 为 
Python 所 在 目录 的 Scripts 目录 中 ， 如 图 11-7 所 示 
区 


I 


装 完成 之 后 出 现 finished 说 明 安装 成 功 。 


chardetect.exe 
PD easy_install.exe 
DB easy_install-3.6.exe 


TipEpy 
从 pip-scriptpy 


图 11-7 命令 所 在 目录 
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(3) 检查 是 否 安装 成 功 ， 使 用 pip3 list 查看 ， 如 图 11-8 所 示 。 


图 11-8 检查 是 否 安装 成 功 
3. 使 用 pip3 导入 一 个 模块 


pip3 install request 


结果 如 图 11-9 所 示 。 


屋 国 如 图 有 固原 国 国 国 固 固 事 生 各 习 回回 生生 轩 因 如 嫩 图 生 访 保 妓 玫 轩 图 
图 11-9 导入 结果 


11.5 “就 业 面试 技巧 与 解析 


关于 包 的 导入 与 使 用 的 考点 并 不 多 ， 掌 握 上 文 所 述 ， 并 加 以 重复 练习 ， 面 试 必 定 得 心 应 手 ! 

面试 官 : 如 何 安装 第 三 方 模块 ? 你 用 过 哪些 第 三 方 模块 ? 

应 聘 者 : 使 用 软件 管理 工具 (pip，pip2，pip3 )。 

Python 2 和 Python 3 都 自 带 了 pip， 而 pip 就 仿佛 有 一 个 仓库 ， 将 需要 安装 的 第 三 方 模块 都 收纳 其 中 ， 
使 用 简单 的 安装 命令 即 可 完成 安装 。 

注意 事项 :用 Python 3 自 带 的 pip 或 者 pip3 安装 的 第 三 方 模块 就 只 能 为 Python 3 的 编译 器 使 用 ， 这 对 
于 Python 2 的 pip 和 pip2 是 同 理 的 。 

具体 安装 方法 :pip3 install 模块 名 。 


常用 第 三 方 模块 如 下 : 
Requests: Kenneth Reitz 写 的 最 富 盛名 的 HITP 库 。 每 个 Python 程序 员 都 应 该 有 它 。 


Scrapy: 如 果 从 事 爬 虫 相关 的 工作 ， 那 么 这 个 库 也 是 必 不 可 少 的 。 

wxPython: Python 的 一 个 GUI (图形 用 户 界 面 ) 工具。 

Pillow: 它 是 PIL (Python 图 形 库 ) 的 一 个 友好 分 支 。 对 于 用 户 比 PIL 更 加 友好 ， 对 于 任何 在 图 形 领域 
工作 的 人 是 必 备 的 库 。 

SQLAlchemy: 一 个 数据 库 的 库 。 
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BeautifulSoup: 这 个 XML 和 HTML 的 解析 库 对 于 新 手 非常 有 用 。 


Twisted: 对 于 网 络 应 用 开发 者 最 重要 的 工具 。 它 有 非常 优美 的 API， 被 很 多 Python 开发 大 牛 使 用 。 


NumPy: 为 Python 提供 了 很 多 高 级 的 数学 方法 。 

SciPy: 这 是 一 个 Python 的 算法 和 数学 工具 库 ， 它 的 功能 把 很 多 科学 家 从 Ruby 吸引 
matplotlib: 一 个 绘制 数据 图 的 库 。 对 于 数据 科学 家 或 分 析 师 非 常 有 用 。 

Pygame: 这 个 库 会 让 你 在 开发 2D 游戏 的 时 候 如 虎 添 贾 。 


| 到 了 Python 。 


Pyglet: 3D 动画 和 游戏 开发 引擎 。 非 常 有 名 的 Python 版 本 Minecraft 就 是 用 这 个 引擎 做 的 。 


pyQT: Python 的 GUI 工具 。 

pyGtk: 也 是 Python GUI 库 。 很 有 名 的 Bittorrent 客户 端 就 是 用 它 做 的 。 
Scapy: 用 Python 写 的 数据 包 探测 和 分 析 库 。 

pywin32: 一 个 提供 和 Windows 交互 的 方法 和 类 的 Python 库 。 

nltk:， 自然 语言 工具 包 。 


F 发 ， 那 么 它 是 必 不 


nose: Python 的 测试 框架 ， 被 成 千 上 万 的 Python 程序 员 使 用 。 如 果 做 测试 导向 的 天 


可 少 的 。 
Sympy 可 以 做 代数 评测 、 差 异化 、 扩 展 、 复 数 等 。 它 封装 在 一 个 Python 发 行 版 本 里 。 

IPython: 它 把 Python 的 提示 信息 做 到 了 极致 ， 包 括 完成 信息 、 历 史 信息 、Shell 功能 ， 以 及 其 他 很 多 
方面 
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第 12 章 
第 13 章 
第 14 章 
第 15 章 
第 16 章 
第 17 章 
第 18 章 


用 Pillow 库 处 理 图 片 
正则 表达 式 

Python 线程 和 进程 
Python 异常 处 理 
程序 测试 与 打包 
数据 结构 基础 
数据 库 编程 


第 12 章 
用 Pillow 库 处 理 图 片 


WP 学 习 指引 


Pillow 库 是 Python 中 用 于 处 理 图 像 的 一 个 库 ， 本 章 针对 Pillow 库 进 行 详细 讲解 。 


二” 重点 导读 


。 了 解 Pillow 库 的 概念 。 

“掌握 使 用 Pillow 库 处 理 图 片 的 方法 。 
。 掌 握 批 量 生成 缩 略图 的 方法 。 

。 掌 握 为 图 片 添加 Logo 的 方法 。 


Pillow 库 是 PIL 库 的 一 个 子 集 ，PIL 库 昌 
式 与 PIL 库 基本 相同 。 


12.1.1 


读 取 图 片 ， 处 理 其 他 图 片 得 到 ， 或 者 直接 创建 一 个 
使 用 Image 模块 中 的 open 函数 打开 一 张 图 片 : 


12.1 ”Pillow 库 概 述 


Pillow 库 处 理 图 像 基础 
Pillow 中 最 重要 的 类 就 是 Image， 该 类 存在 于 同名 的 模块 中 ， 可 以 通过 以 下 几 种 方式 实例 化 :从 文件 中 


>>> from PIL import Image 
>>> im = Image.open("lena.ppm") 


>>> from _ future import print function 
>>> print (im.format, im.size, im.mode) 


PPM (512, 512) RGB 


片 ， 该 类 也 是 绘图 基础 。 


如 果 打 开 成 功 ， 返 回 一 个 Image 对 象 ， 可 以 通过 对 象 属性 检查 文件 内 容 : 


昌 于 不 支持 Python 3.0， 因 此 派生 出 了 Pillow 库 ， 该 库 的 操作 方 


format 属性 定义 了 图 像 的 格式 ， 如 果 图 像 不 是 从 文件 打开 的 ， 那 么 该 属性 值 为 None; size 属性 是 一 个 


元 组 ， 表 示 


图 


像 的 宽 和 高 (单位 为 像素 )，mode 属性 表示 图 


像 的 模式 ， 常 用 的 模式 有 : 工 为 灰 度 


图 


，RGB 
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为 真 彩色 ，CMYK 为 印 前 图 像 。 

如 果 文 件 不 能 打开 ， 则 抛 出 IOError 异常 。 

当 有 一 个 Image 对 象 时 ， 可 以 用 Image 类 的 各 个 方法 进行 处 理 和 操作 图 像 ， 例 如 显示 

>>> im.show() 

注意 : 标准 版 本 的 show0 方 法 不 是 很 有 效率 ， 因 为 它 先 将 图 像 保 存在 一 个 临时 文件 ， 然 后 使 用 xv 进行 
显示 。 如 果 没有 安装 xv， 该 函数 甚至 不 能 工作 。 但 是 该 方法 非常 便于 debug 和 test。(Windows 中 应 该 调用 
默认 图 片 查看 器 打开 。) 

1. 读 写 图 片 

Pillow 库 支持 相当 多 的 图 片 格式 。 直接 使 用 Image 模块 中 的 open0 函 数 读 取 图 片 , 而 不 必 先 处 理 图 片 的 
格式 ，Pillow 库 将 自动 根据 文件 决定 格式 。 

Image 模块 中 的 save0 函 数 可 以 保存 图 片 , 除非 指定 文件 格式 , 那么 文件 名 中 的 扩展 名 用 来 指定 文件 格式 。 

1) 图 片 转 成 jpg 格式 


from _ future ”import print function 
import os, sys 
from PIL import Image 
for infile in sys.argv[1:]: 
f, e = os.path.splitext (infile) 
outfile = f + ".jpg" 
if infile != outfile: 
trys 
Image.open (infile) .save (outfile) 
except IOError: 
print ("cannot convert", infile) 


save(0 函 数 的 第 二 个 参数 可 以 用 来 指定 图 片 格式 ， 如 果 文件 名 中 没有 给 出 一 个 标准 的 图 像 格式 ， 那 么 第 
二 个 参数 是 必需 的 。 
2) 创建 缩 略图 
from _ future _ import print function 
import os, sys 
from PIL import Image 
size = (128, 128) 
for infile in sys.argv[1:]: 
outfile = os.path.splitext (infile) [0] + ".thumbnail" 


| 


片 : 


EF infile l= outfiles 
try: 
im = Image.open (infile) 
im.thumbnail (size) 


im.save (outfile, "JPEG") 
except IOError: 
print ("cannot create thumbnail for", infile) 


必须 指出 的 是 ， 除 非 必需 ， 否 则 Pillow 不 会 解码 。 打 开 一 个 文件 时 ，Pillow 通过 文件 头 确定 文件 格式 、 
大 小 、mode 等 数据 ， 余 下 数据 直到 需要 时 才 处 理 。 

这 意味 着 打开 文件 非常 快 ， 与 文件 大 小 和 压缩 格式 无 关 。 下 面 的 程序 用 来 快速 确定 图 片 属性 。 

3) 确定 图 片 属性 

from _ future import print function 


import sys 
from PIL import Image 


for infile in sys.argv[1:]: 
try: 
with Image.open (infile) as im: 
print (infile, im.format, "%dx%d" ss im.size, im.mode) 
except IOError: 
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pass 


2. 裁剪 、 粘 贴 与 合并 图 片 

Image 类 还 包含 操作 图 片区 域 的 方法 。 例 如 ，crop0 方 法 可 以 从 图 片 中 提取 一 个 子 和 矩 形 。 
1) 从 图 片 中 复制 子 图 像 

box = im.copy () # 直 接 复制 图 像 


box = (100, 100, 400, 400) 
region = im.crop (box) 


region 由 4-tuple 决定 ， 该 tuple 中 信息 为 (left,upper,right,lower)。 Pillow 左边 系统 的 原点 (0，0) 为 
图 片 的 左上 角 。 坐 标 中 的 数字 单位 为 像素 点 ， 所 以 上 例 中 截取 的 图 片 大 小 为 〈300 像素 x300 像素 ) ^2。 

2) 处 理子 图 ， 粘 贴 回 原 图 

region = region.transpose (Image.ROTATE 180) 

im.paste (region, box) 

将 子 图 粘贴 回 原 图 时 ， 子 图 的 region 必须 和 给 定 box 的 region 吻合 ， 该 region 不 能 超过 原 图 。 而 原 图 
和 region 的 mode 不 需要 匹配 ，Pillow 会 自动 处 理 。 

3) 滚动 图 像 

def roll (image, delta): 

"Roll an image sideways" 


image = image.copy() # 复 制图 像 

xsize, ysize = image.size 

delta = delta % xsize 

if delta == 0: return image 

partl = image.crop((0, 0, delta, ysize)) 

part2 = image.crop((delta, 0, xsize, ysize)) 
image.paste(part2, (0, 0, xsize-delta, ysize)) 
image.paste (partl, (xsize-delta, 0, xsize, ysize)) 
return image 


3. 分 离 和 合并 通道 
r, g, b = im.split() 
im = Image.merge ("RGB", (b, g, r)) 


对 于 单 通道 图 片 ，split0 返 回 图 像 本 身 。 为 了 处 理 单 通 道 图 片 ， 必 须 先 将 图 片 转 成 RGB。 


12.1.2 Image 模块 


Image 模块 是 PIL 中 最 重要 的 模块 , 它 有 一 个 类 叫 作 image, 与 模块 名 称 相同 。 本 节 主 要 讲解 Image 模块 。 
1. Image 类 的 属性 


1) format 

源 文件 的 文件 格式 。 如 果 是 由 PIL 创建 的 图 像 ， 则 其 文件 格式 为 None。 
下 面 给 出 一 段 关于 format 属性 的 实例 。 

>>>from PIL import Image 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 


>>>im.format 
"JPEG' 


注意 : testjpg 是 JPEG 图 像 ， 所 以 其 文件 格式 为 JPEG。 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.gif") 
>>>im.format 

‘GIF' 


注意 : test.gif 为 GIF 文件 ， 所 以 其 文件 格式 为 GIF。 


器 


回 
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2) mode 
图 像 的 模式 。 这 个 字符 串 表 明 图 像 所 使 用 的 像素 格式 。 该 属性 典型 的 取 值 为 “1”“L”“RGB” 或 


“CMYK” 。 


下 面 给 出 一 段 关于 mode 属性 的 实例 。 

>>>from PIL import Image 

>>> im = Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 
>>> im.mode 

?RGB 

>>> im = Image.open("D:\\Code\\Python\\test\\img\\test.gif") 
>>> im.mode 

py 


3) size 

图 像 的 尺寸 ， 按 照 像 素数 计算 。 它 的 返 | 
下 面 给 出 一 段 关于 size 属性 的 实例 。 
>>>from PIL import Image 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 
>>>im.size 

(800, 450) 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.gif") 
>>> im.size 

(400, 220) 


4) palette 

颜色 调 色 板 表格 。 如 果 图 像 的 模式 是 “P”， 则 返 
下 面 给 出 一 段 关于 palette 属性 的 实例 。 

>>> from PIL import Image 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 
>>> im.mode 

1RGB! 

>>>im.palette 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.gif") 
>>> im.mode 

"py 

>>>im.palette 

<PIL.Imagepalette.Imagepaletteobject at 0x035E7ADO> 

>>> pl= im.palette 


pl 为 ImagePalette 类 的 实例 。 
5) info 
存储 图 像 相关 数据 的 字典 。 文 件 句 柄 使 用 该 字典 传递 从 文件 中 读 取 的 各 种 非 图 像 信息 。 大 多 数 方法 在 


器 


值 为 宽度 和 高 度 的 二 元 组 (width,height)。 


器 


ImagePalette 类 的 实例 ， 否 则 将 为 None。 


新 的 图 像 时 都 会 忽略 这 个 字典 ， 因 为 字典 中 的 键 并 非 标准 化 的 ， 对 于 一 个 方法 ， 它 不 能 知道 自己 的 操 


作 如 


可 影响 这 个 字典 。 如 果 用 户 需要 这 些 信息 ， 需 要 在 open0 方 法 返回 时 保存 这 个 字典 。 

下 面 给 出 一 段 关 于 info 属性 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 

>>>im.info 

{'jfif version': (1, 1), 'jfif': 257, "jfif unit': 1, 'jfif density': (96, 96), 'dpi': (96, 96)} 
>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.gif") 

>>>im.info 

{'duration':100, 'version': 'GIF89a', 'extension': ('NETSCAPE2.0', 795L), 'background': 0,'loop': 0} 


2. Image 类 的 常用 函数 


1) new 


JImage.new(mode.size) 一 image 
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JImage.new(mode,size,coloD) 僵 image 


使 用 给 定义 的 变量 mode 和 size 生成 新 的 图 像 。size 是 给 定 的 宽 / 高 二 元 组 ， 这 是 按照 像素 数 来 计算 的 。 


对 于 单 通道 图 像 ， 变 量 color 只 给 定 一 个 值 ， 对 于 多 通道 图 像 ， 变 量 color 给 定 一 个 元 组 (每 个 通道 对 应 一 
个 值 )。 在 版 本 1.1.4 及 其 之 后 ， 用 户 也 可 以 用 颜色 的 名 称 ， 例 如 给 变量 color 赋值 为 “red”。 如 果 没 有 对 
变量 color 赋值 ， 图 像 内 容 将 会 被 全 部 赋值 为 0 (图 像 即 为 黑色 )。 如 果 变 量 color 是 空 ， 图 像 将 不 会 被 初始 


化 ， 


即 图 像 的 内 容 全 为 0。 这 对 该 图 像 复制 或 绘制 某 些 内 容 是 有 用 的 。 
下 面 给 出 一 段 关 于 newO 函 数 的 实例 ， 具 体 代码 如 下 。 


>>>from PIL import Image 
>>> im= Image.new("RGB"， (128, 128), "#FF0000") 


>>>im.show() 
图 像 im 为 128 x 128 大 小 的 红色 图 像 。 


>>> im= Image.new("RGB", (128, 128)) 
>>>im.show() 


图 像 im 为 128 x 128 大 小 的 黑色 图 像 ， 因 为 变量 color 不 赋值 的 话 ， 图 像 内 容 被 设置 为 0， 即 黑色 。 


>>> im= Image.new("RGB"， (128, 128), "red") 


>>>im.show 
图 像 im 为 128 x 128 大 小 的 红色 图 像 。 
2) open 


JImage.open(file) 僵 image 
Image.open(file,mode) 僵 image 
打开 并 确认 给 定 的 图 像 文件 。 这 是 一 个 懒 操 作 ， 该 函数 只 会 读 文件 头 ， 而 真实 的 图 像 数 据 直 到 试图 处 


理 该 数据 时 才 会 从 文件 读 取 (调用 load( 方 法 将 强行 加 载 图 像 数据 )。 如 果 变量 mode 被 设置 , 那 必 须 是 “r”。 


实现 read0、seek0 和 tell0 方 法 ， 并 且 以 二 进 制 模式 打开 。 


用 户 可 以 使 用 一 个 字符 串 〈 表 示 文 件 名 称 的 字符 串 ) 或 者 文件 对 象 作 为 变量 file 的 值 。 文 件 对 象 必须 


下 面 给 出 一 段 关 于 open0 函 数 的 实例 ， 具 体 代码 如 下 。 

>>> from PIL import Image 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg") 

>>>im. show() 

>>> im= Image.open("D:\\Code\\Python\\test\\img\\test.jpg", "r") 

>>>im. show() 

3) blend 

JImage.blend(imagel,image2.alpha) 一 image 

使 用 给 定 的 两 张 图 像 及 透明 度 变量 alpha, 插值 出 一 张 新 的 图 像 。 这 两 张 图 像 必 须 有 一 样 的 尺寸 和 模式 。 
合成 公式 为 : 
out = imagel Xx (1.0-alpha)+ image2 X alpha 

如 果 变量 alpha 为 0.0， 将 返回 第 一 张 图 像 的 拷贝 ， 如 果 变 量 alpha 为 1.0， 将 返回 第 二 张 图 像 的 拷贝 。 


对 变量 alpha 的 值 没有 限制 。 


下 面 给 出 一 段 关 于 blend0 函 数 的 实例 ， 具 体 代 码 如 下 。 

>>>from PIL import Image 

>>> im01 =Image.open("D:\\Code\\Python\\test\\img\\test01.jpg") 
>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im =Image.blend (im01, im02, 0.3) 

>>> im.show() 


test01.jpg 和 test02.jpg 两 张 图 像 的 size 都 为 1024 X 768, mode 为 RGB。 它们 按照 第 一 张 70% 的 透明 度 ， 


第 二 张 30% 的 透明 度 ， 合 成 为 一 张 。 
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4) composite 

Image.composite(imagel,image2.mask) 僵 image 

使 用 给 定 的 两 张 图 像 及 mask 图 像 作为 透明 度 ， 插 值 出 一 张 新 的 图 像 。 变 量 mask 即 图 像 的 模式 ， 可 以 
为 1、 工 或 者 RGBA。 所 有 图 像 必须 有 相同 的 尺寸 。 

下 面 给 出 一 段 关 于 composite0 函 数 的 实例 ， 具 体 代 码 如 下 。 

>>>from PIL import Image 

>>> im01 =Image.open("D:\\Code\\Python\\test\\img\\test01.jpg") 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>>r,g1b = im01.split() 

>>> g.mode 

4" 

>>> g.size 

(1024，768) 

>>> im= Image.composite(im01, im02, g) 

>>>im.show() 


5) eval 

JImage.eval(image,function) 一 image 

使 用 变量 function 对 应 的 函数 〈 该 函数 应 该 有 一 个 参数 ) 处 理 变量 image 所 代表 图 像 中 的 每 一 个 像素 
点 。 如 果 变 量 image 所 代表 图 像 有 多 个 通道 ， 那 变量 function 对 应 的 函数 作用 于 每 一 个 通道 。 注 意 : 变量 
function 对 每 个 像素 只 处 理 一 次 ， 所 以 不 能 使 用 随机 组 件 和 其 他 生成 器 。 

下 面 给 出 一 段 关 于 eval0 函 数 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image 

>>>im01 = Image.open("D:\\Code\\Python\\test\\img\\test01.jpg") 

>>> deffun(x) : 

return x * 0.5 

>>>im eval = Image.eval (im01, fun) 


>>>im eval.show() 
>>>im01.show() 


6) frombuffer 

Image.frombuffer(mode,size,data) 一 image 

Image.frombuffer(mode,size,data.decoderparameters) 一 image 

使 用 标准 的 “raw” 解 码 器 ， 从 字符 捉 或 者 buffer 对 象 中 的 像素 数据 产生 一 个 图 像 存 储 。 对 于 一 些 模式 , 这 
个 图 像 存 储 与 原始 的 buffer (这 意味 着 对 原始 buffer 对 象 的 改变 体现 在 图 像 本 身 ) 共享 内 存 。 并 非 所 有 的 模式 都 
可 以 共享 内 存 ; 支持 的 模式 有 工 、RGBX、RGBA 和 CMYK。 对 于 其 他 模式 , 这 个 函数 与 fromstring0 函 数 一 致 。 

注意 : 版 本 1.1.6 及 其 以 下 , 这 个 函数 的 默认 情况 与 函数 fromstring0) 不 同 。 这 有 可 能 在 将 来 的 版 本 中 改 
变 ， 所 以 为 了 最 大 的 可 移植 性 ， 当 使 用 “raw” 解 码 器 时 ， 推 荐 用 户 写 出 所 有 的 参数 ， 如 下 所 示 。 

im =Image.frombuffer(mode,size,data,"raw",mode,0,1) 

函数 Image.frombuffer(mode,size,data,decoder,parameters) 与 函数 fomstring0 的 调用 一 致 。 

7) fromstring 

JImage.fromstring(mode,size,data) 一 image 

Tmage.fromstring(mode,size,data,decoder,parameters)—> image 

函数 Image.fromstring(mode,size,data) 使 用 标准 的 “raw” 解 码 器 ， 从 字符 串 中 的 像素 数据 产生 一 个 图 像 存 储 。 

函数 Image.fromstring(mode,size,data,decoder,parameters) 也 一 样 ， 但 是 允许 用 户 使 用 PIL 支持 的 任何 像 
素 解码 器 。 

注意 : 这 个 函数 只 对 像素 数据 进行 解码 ， 而 不 是 整个 图 像 。 如 果 用 户 的 字符 串 包含 整个 图 像 ， 可 以 将 
该 字符 串 包 衷 在 StringIO 对 象 中 ， 使 用 函数 open0 来 加 载 。 
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8) merge 

JImage.merge(mode,bands) 僵 image 

使 用 一 些 单 通道 图 像 ， 创 建 一 个 新 的 图 像 。 变 量 bands 为 一 个 图 像 的 元 组 或 者 列表 ， 每 个 通道 的 模式 
由 变量 mode 描述 。 所 有 通道 必须 有 相同 的 尺寸 。 

变量 mode 与 变量 bands 的 关系 为 : 

len (ImageMode .getmode (mode) .bands)= len (bands) 

下 面 给 出 一 段 关于 merge0 函 数 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image 

>>>im01 = Image.open("D:\\Code\\Python\\test\\img\\test01.jpg") 

>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>>r1,g1,bl im01.split() 

>>>r2,g2,b2 im02.split() 

>>>r1 .mode 

4" 

>>>r1.size 

(1024, 768) 

>>>gl1 .mode 

4" 

>>>g1.5ize 

(1024，768) 

>>>r2 .mode 

‘LD! 

>>>g2.size 

(1024, 768) 

>>>imgs=[r1,g2,b2] 

>>>len (ImageMode .getmode ("RGB") .bands) 

>>>len (imgs) 

EE 


>>>im merge = Image.merge ("RGB", imgs) 
>>>im merge.show() 


12.1.3 ”使 用 ImageChops 模块 进行 图 片 合成 


前 面 了 解 了 Pillow 的 基础 Image 类 ， 本 节 将 讲解 ImageChops 类 。ImageChops 模块 包含 一 些 算术 图 形 操 
作 ， 叫 作 channel operations ("chops") 。 这 些 操作 可 用 于 诸多 目的 ， 例 如 图 像 特 效 、 图 像 组 合 、 算 法 绘图 等 。 
ImageChops 模块 的 函数 大 多 有 一 个 或 者 两 个 图 像 参 数 ， 返 回 一 个 新 的 图 像 。 


1. constant 


器 


constant(image,value) 一 image 


返回 一 个 和 给 定 图 像 尺寸 一 样 的 层 ， 该 层 被 给 定 的 像素 值 填充 。 
2. duplicate 


器 


duplicate(image) 僵 image 
返回 给 定 图 像 的 乒 贝 。 


3. invert 


器 


invert(image) 一 image 
返回 最 大 值 255 减 去 当前 值 的 图 像 。 
4. lighter 


回 


lighterdmagel,image2) 僵 image 
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逐 像素 比较 ， 选 择 较 大 值 作为 新 图 像 的 像素 值 。 
5. darker 


darker(imagel,image2)> image 
逐 像素 比较 ， 选 择 较 小 值 作为 新 图 像 的 像素 值 。 


6. difference 


difference(imagel,image2) 一 image 
返回 两 幅 图 像 逐 像素 差 的 绝对 值 形成 的 图 像 。 
7. multiply 


multiply(imagel,image?2)> image 
如 果 与 一 张 纯 黑 图 片 相 乘 ， 其 结果 是 黑色 的 。 如 果 与 一 张 纯 白 图 像 相 乘 ， 其 结果 是 不 确定 的 。 


8. screen 


Screen(imagel,image2) 一 image 


将 两 个 倒立 的 图 像 琶 加 在 一 起 。 
9. add 


add(imagel,image2.scale.offseb 一 image 
两 个 图 像 对 应 像素 值 相 加 ， 然 后 除 以 变量 scale， 并 且 再 加 上 变量 offset。 如 果 忽 略 ， 变 量 scale 为 1.0， 
变量 offset 为 0.0。 


10. subtract 


subtract(imagel,image?2,scale,offset)—> image 
两 个 图 像 对 应 像素 值 相 减 ， 然 后 除 以 变量 scale， 并 且 再 加 上 变量 offset。 如 果 忽 略 ， 变 量 scale 为 1.0， 
变量 offset 为 0.0。 


11. blend 


blend(imagel,image2,alpha) 一 image 
与 Image 模块 中 的 函数 blend0 一 样 ， 根 据 变量 alpha 合成 两 张 图 像 。 


12. composite 


composite(imagel,image2,mask) 一 image 

与 Image 模块 中 的 函数 composite0 一 样 ， 根 据 变量 mask 合成 两 张 图 像 。 变 量 mask 的 模式 为 1、 工 或 
者 RGBA。 这 三 个 参数 的 尺寸 必须 一 样 大 。 

13. offset 

offset(image,xoffset,yoffset)—> image 


offset(image,offset)—> image 
返回 一 个 图 像 数据 按照 变量 offset 做 了 偏 移 的 图 像 。 如 果 变量 yoffset 缺 省 , 它 将 被 假设 与 变量 xoffset 一 样 。 


12.1.4 使 用 ImageEnhance 模块 
ImageEnhance 模块 提供 了 一 些 用 于 图 像 增强 的 类 。 
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1. ImageEnhance 模块 的 接口 
所 有 的 增强 类 都 实现 了 一 个 通用 的 接口 ， 包 括 一 个 方法 : 
enhancer .enhance (factor) 3 image 


该 方法 返回 一 个 增强 过 的 图 像 。 变 量 factor 是 一 个 浮 点 数 ， 控 制图 像 的 增强 程度 。 变 量 factor 为 1 


将 返回 原始 图 像 的 拷贝 ，factor 值 越 小 ， 颜 色 越 少 〈 亮 度 、 对 比 度 等 )。 


口 如 下 


2. ImageEnhance 模块 的 Color 类 
颜色 增强 类 用 于 调整 图 像 的 颜色 均衡 ， 在 某 种 程度 上 类 似 控 制 彩色 电视 机 的 颜色 。 该 类 实现 的 增强 接 


二 IE 本 3 color enhancer instance 
创建 一 个 增强 对 象 ， 以 调整 图 像 的 颜色 。 增 强 因 子 为 0.0 将 产生 黑白 图 像 ， 为 1.0 将 给 出 原始 图 像 。 
下 面 给 出 一 段 关于 ImageEnhance.Color 类 的 实例 ， 具 体 代码 如 下 。 


>>> from PIL import Image, ImageEnhance 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im 1 = ImageEnhance.Color (im02) .enhance (0.1) 

>>> im 5 = ImageEnhance.Color (im02) .enhance (0.5) 

>>> im 8 =ImageEnhance.Color (im02) .enhance (0.8) 

>>> im 20 = ImageEnhance.Color (im02) .enhance (2.0) 


enhance() 的 参数 factor 决定 着 图 像 的 颜色 饱和 度 情况 ， 从 0.1 到 0.5， 再 到 0.8，2.0， 图 像 的 颜色 饱和 


度 依 次 增 大 。 


3. ImageEnhance 模块 的 Brightness 类 

亮度 增强 类 用 于 调整 图 像 的 亮度 。 

ImageEnhance.Brightness (image)3 Brightnessenhancer instance 

创建 一 个 调整 图 像 亮度 的 增强 对 象 。 增 强 因 子 为 0.0 将 产生 黑色 图 像 ， 为 1.0 将 保持 原始 图 像 。 
下 面 给 出 一 段 关 于 ImageEnhance.Brightness 类 的 实例 ， 具 体 代 码 如 下 。 

>>> from PIL import Image, ImageEnhance 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>> im 2 = ImageEnhance.Brightness (im02) .enhance (0.2) 

>>> im 5 = ImageEnhance.Brightness (im02) .enhance (0.5) 


>>> im 8 =ImageEnhance.Brightness (im02) .enhance(0.8) 
>>> im 20 =ImageEnhance.Brightness (im02) .enhance(2.0) 


该 函数 enhance0 的 参数 factor 决定 着 图 像 的 亮度 情况 。 从 0.1 到 0.5， 再 到 0.8，2.0， 图 像 的 亮度 依次 增 大 。 
4. ImageEnhance 模块 的 Contrast 类 
对 比 度 增强 类 用 于 调整 图 像 的 对 比 度 。 


ImageEnhance.Contrast (image) 3 Contrast enhancer instance 

创建 一 个 调整 图 像 对 比 度 的 增强 对 象 。 增 强 因 子 为 0.0 将 产生 纯 灰色 图 像 ， 为 1.0 将 保持 原始 图 像 。 
下 面 给 出 一 段 关 于 ImageEnhance.Contrast 类 的 实例 ， 具 体 代 码 如 下 。 

>>> from PIL import Image, ImageEnhance 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>> im 1 = ImageEnhance.Contrast (im02) .enhance (0.1) 

>>> im 5 = ImageEnhance.Contrast (im02) .enhance (0.5) 


>>> im 8 =ImageEnhance.Contrast (im02) .enhance (0.8) 
>>> im 20 =ImageEnhance.Contrast (im02) .enhance(2.0) 


该 函数 enhance0 的 参数 factor 决定 着 图 像 的 对 比 度 情况 ， 从 0.1 到 0.5， 再 到 0.8，2.0， 图 像 的 对 比 度 


依次 增 大 。 
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5. ImageEnhance 模块 的 Sharpness 类 
锐 度 增强 类 用 于 调整 图 像 的 锐 度 。 


ImageEnhance .Sharpness (image) 3 Sharpness enhancer instance 


创建 一 个 调整 图 像 锐 度 的 增强 对 象 。 增 强 因 子 为 0.0 将 产生 模糊 图 像 ， 为 1.0 将 保持 原始 图 像 ， 为 2.0 


将 7 


12.1.5 ”使 用 ImageFilter 模块 


生 锐 化 过 的 图 像 。 

下 面 给 出 一 段 关 于 ImageEnhance.Sharpness 类 的 实例 ， 具 体 代码 如 下 。 
>>> from PIL import Image, ImageEnhance 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im 0 = ImageEnhance.Sharpness (im02) .enhance (0.0) 

>>> im 20 =ImageEnhance.sharpness (im02) .enhance(2.0) 

>>> im 30 =ImageEnhance.Sharpness (im02) .enhance(3.0) 


该 函数 enhance() 的 参数 factor 决定 着 图 像 的 锐 度 情 况 ， 从 0.0 到 2.0， 再 到 3.0， 图 像 的 锐 度 依次 增 大 。 


ImageFilter 模块 提供 了 滤波 器 相关 定义 ， 这 些 滤波 器 主要 用 于 Image 类 的 filter0 方 法 。 
1. ImageFilter 模块 所 支持 的 滤波 器 

当前 的 PIL 版 本 中 ImageFilter 模块 支持 以 下 十 种 滤波 器 。 

1) BLUR 

ImageFilter.BLUR 为 模糊 滤波 ， 处 理 之 后 的 图 像 会 整体 变 得 模糊 。 

下 面 给 出 一 段 关于 ImageFilterBLUR 的 实例 ， 具 体 代 码 如 下 。 

>>> from PIL importImageFilter 


>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im = im02.filter (ImageFilter.BLUR) 


2) CONTOUR 
ImageFilter.CONTOUR 为 轮廓 滤波 ， 将 图 像 中 的 轮廓 信息 全 部 提取 出 来 。 
下 面 给 出 一 段 关于 ImageFilter.CONTOUR 的 实例 ， 具 体 代 码 如 下 。 


>>>from PIL import ImageFilter 

>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.CONTOUR) 

3) DETAIL 

ImageFilter.DETAIL 为 细节 增强 滤波 ， 会 使 得 图 像 中 的 细节 更 加 明显 。 
下 面 给 出 一 段 关于 ImageFilter.DETAIL 的 实例 ， 具 体 代码 如 下 。 
>>>from PIL import ImageFilter 

>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.DETAIL) 

4) EDGE ENHANCE 


ImageFilter.EDGE_ENHANCE 为 边缘 增强 滤波 ， 是 突出 、 加 强 和 改善 图 像 中 不 同 灰 度 区 域 之 间 的 边界 


和 轮廓 的 图 像 增 强 方法 。 经 处 理 使 得 边界 和 边缘 在 图 像 上 表现 为 图 像 灰 度 的 突变 ， 用 以 提高 人 眼 识别 能 力 。 


下 面 给 出 一 段 关于 ImageFilter.EDGE_ENHANC 的 实例 ， 具 体 代码 如 下 。 
>>>from PIL import ImageFilter 

>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.EDGE ENHANCE) 

5) EDGE ENHANCE MORE 


ImageFilter.EDGE_ENHANCE_MORE 为 深度 边缘 增强 滤波 ， 会 使 得 图 像 中 边缘 部 分 更 加 明显 。 
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下 面 给 出 一 段 关 于 ImageFilterEDGE_ ENHANCE MORE 的 实例 ， 具 体 代码 如 下 。 
>>>from PIL import ImageFilter 


>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.EDGE ENHANCE MORE) 


6) EMBOSS 
ImageFilter.EMBOSS 为 浮雕 滤波 ， 会 使 图 像 呈现 出 浮雕 效果 。 
下 面 给 出 一 段 关于 ImageFilterEMBOSS 的 实例 ， 具 体 代 码 如 下 。 


>>>from PIL import ImageFilter 
>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.EMBOSS) 


7) FIND EDGES 
JImageFilterFIND_EDGES 为 寻找 边缘 信息 的 滤波 ， 会 找 出 图 像 中 的 边缘 信息 。 
下 面 给 出 一 段 关于 ImageFilterFIND_EDGES 的 实例 ， 具 体 代 码 如 下 。 


>>>from PIL import ImageFilter 
>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.FIND EDGES) 


8) SMOOTH 

ImageFilter.SMOOTH 为 平滑 滤波 ， 突 出 图 像 的 宽大 区 域 、 低 频 成 分 、 主 干部 分 或 抑制 图 像 噪声 和 干扰 
高 频 成 分 ， 使 图 像 亮度 平缓 渐变 ， 减 小 突变 梯度 ， 改 善 图 像 质量 。 

下 面 给 出 一 段 关于 ImageFilter.SMOOTH 的 实例 ， 具 体 代码 如 下 。 


>>>from PIL import ImageFilter 
>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im= im02.filter(ImageFilter.SMOOTH) 


9) SMOOTH MORE 
ImageFilterSMOOTH MORE 为 深度 平滑 滤波 ， 会 使 得 图 像 变 得 更 加 平滑 。 
下 面 给 出 一 段 关 于 ImageFilterSMOOTH_ MORE 的 实例 ， 具 体 代 码 如 下 。 


>>> from PIL importImageFilter 
>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im =im02.filter (ImageFilter.SMOOTH MORE) 


10) SHARPEN 

ImageFilter.SHARPEN 为 锐 化 滤波 ,补偿 图 像 的 轮廓 ,增强 图 像 的 边缘 及 灰 度 跳 变 的 部 分 ,使 图 像 变 得 
清晰 。 

下 面 给 出 一 段 关于 ImageFilter.SHARPEN 的 实例 ， 具 体 代码 如 下 。 


>>>from PIL import ImageFilter 
>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im =im02.filter(ImageFilter.SHARPEN) 


2. ImageFilter 模块 的 函数 
1) Kemel 
Kernel(size,kernel,scale=None.offset=0) 
生成 一 个 给 定 尺 寸 的 卷 积 核 。 在 当前 的 版 本 中 ， 变 量 size 必须 为 (3，3) 或 者 (5，5)。 变 量 kemel 
与 变量 size 对 应 地 必须 为 包含 9 个 或 者 25 个 整数 或 者 浮 点 数 的 序列 。 
如 果 设 置 了 变量 scale， 将 卷 积 核 作 用 于 每 个 像素 值 之 后 的 数据 ， 都 需要 除 以 这 个 变量 。 默 认 值 为 卷 积 
核 的 权重 之 和 。 
如 果 设 置 变量 offset， 这 个 值 将 加 到 卷 积 核 作 用 的 结果 上 ， 然 后 再 除 以 变量 scale。 
下 面 给 出 一 段 关于 Kernel 的 实例 ， 具 体 代码 如 下 。 
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>>>from PIL import ImageFilter 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>> im=im02.filter(ImageFilter.Kernel((3,3), (1,1,1,0,0,0,2,0,2))) 

2) RankFilter 

RankFilter(size,rank) 

生成 给 定 尺 寸 的 等 级 滤波 器 。 对 于 输入 图 像 的 每 个 像素 点 ， 等 级 滤波 器 根据 像素 值 ， 在 (size，size) 
区域 中 对 所 有 像素 点 进行 排序 ， 然 后 复制 对 应 等 级 的 值 存储 到 输出 图 像 中 。 

下 面 给 出 一 段 关 于 RankFilter 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import ImageFilter 


>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im=im02.filter(ImageFilter.RankFilter (5,24)) 


图 像 im 为 等 级 滤波 后 的 图 像 ， 在 每 个 像素 点 为 中 心 的 5x5 区 域 25 个 像素 点 中 选择 排序 第 24 位 的 像 


出 


素 作为 新 的 值 。 


3) MinFilter 

MinFilter(size=3) 

生成 给 定 尺 寸 的 最 小 滤波 器 。 对 于 输入 图 像 的 每 个 像素 点 ， 该 滤波 器 从 〈size，size) 的 区 域 中 复制 最 
小 的 像素 值 存储 到 输出 图 像 中 。 

下 面 给 出 一 段 关 于 MinFilter 的 实例 ， 具 体 代码 如 下 。 

>>> from PIL importImageFilter 


>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im=im02.filter(ImageFilter.MinFilter(5)) 


图 像 im 为 最 小 滤波 后 的 图 像 , 在 每 个 像素 点 为 中 心 的 5x5 区 域 25 个 像素 点 中 选择 最 小 的 像素 作为 新 
的 值 。 

4) MedianFilter 

MedianFilter(size=3) 

生成 给 定 尺 寸 的 中 值 滤波 器 。 对 于 输入 图 像 的 每 个 像素 点 ， 该 滤波 器 从 〈size，size) 的 区 域 中 复制 中 
值 对 应 的 像素 值 存储 到 输出 图 像 中 。 

下 面 给 出 一 段 关 于 MedianFilter 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import ImageFilter 


>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im=im02.filter (ImageFilter.MedianFilter(5)) 


图 像 im 为 中 值 滤波 后 的 图 像 ， 在 每 个 像素 点 为 中 心 的 5x 5 区 域 25 个 像素 点 中 选择 中 值 作为 新 的 值 。 
5) MaxFilter 

MaxFilter(size=3) 

生成 给 定 尺 寸 的 最 大 滤波 器 。 对 于 输入 图 像 的 每 个 像素 点 ， 该 滤波 器 从 〈size，size) 的 区 域 中 复制 最 
大 的 像素 值 存储 到 输出 图 像 中 。 
下 面 给 出 一 段 关 于 MaxFilter 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import ImageFilter 

>>> im02 =Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 
>>> im=im02.filter(ImageFilter.MaxFilter(5)) 


的 值 。 


图 像 im 为 最 大 滤波 后 的 图 像 , 在 每 个 像素 点 为 中 心 的 5x5 区 域 25 个 像素 点 中 选择 最 大 的 像素 作为 新 
6) ModeFilter 
ModeFilter(size=3) 
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生成 给 定 斥 寸 的 模式 滤波 器 。 对 于 输入 图 像 的 每 个 像素 点 ， 该 滤波 器 从 〈size，size) 的 区 域 中 复制 出 
现 次 数 最 多 的 像素 值 存储 到 输出 图 像 中 。 如 果 没有 一 个 像素 值 出 现 过 两 次 及 其 以 上 ， 则 使 用 原始 像素 值 。 
下 面 给 出 一 段 关 于 ModeFilter 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import ImageFilter 

>>>im02 = Image.open("D:\\Code\\Python\\test\\img\\test02.jpg") 

>>> im=im02.filter(ImageFilter.ModeFilter (5)) 

图 像 im 为 模式 滤波 后 的 图 像 , 在 每 个 像素 点 为 中 心 的 5x5 区 域 25 个 像素 点 中 选择 出 现 次 数 最 多 的 像 
素 作为 新 的 值 。 


12.1.6 ”使 用 ImageDraw 模块 画图 


ImageDraw 模块 提供 了 图 像 对 象 的 简单 2D 绘制 , 用 户 可 以 使 用 这 个 模块 创建 新 的 图 像 , 注释 或 润 饰 已 
存在 图 像 。 
1. ImageDraw 模块 


1) Coordinates 

绘图 接口 使 用 和 PIL 一 样 的 坐标 系统 ， 即 (0,0) 为 左上 角 。 

2) Colours 

为 了 指定 颜色 ， 用 户 可 以 使 用 数字 或 者 元 组 ， 对 应 用 户 使 用 函数 Image.new 或 者 Image.putpixel。 对 于 
模式 为 1、L 和 I 的 图 像 ， 使 用 整数 ， 对 于 RGB 图 像 ， 使 用 整数 组 成 的 三 元 组 ， 对 于 下 图 像 ， 使 用 整数 或 
者 浮 点 数 。 

对 于 调 色 板 图 像 (模式 为 P)， 使 用 整数 作为 颜色 索引 。 在 PIL 1.1.4 及 其 以 后 版 本 中 ， 用 户 也 可 以 使 用 
RGB 三 元 组 或 者 颜色 名 称 。 绘 制 层 将 自动 分 配 颜 色 索引 ， 只 要 用 户 不 绘制 多 于 256 种 颜色 即 可 。 

3) Colours Names 

在 PIL 1.1.4 及 其 以 后 的 版 本 中 , 用 户 绘制 RGB 图 像 时 , 可 以 使 用 字符 串 常 量 。 PIL 支持 如 下 字符 串 格式 。 

(1) 十 六 进 制 颜色 说 明 符 ， 定 义 为 “要 gb” 或 者 “#rggbb”。 例 如 ，“#ff0000” 表 示 纯 红色 。 

(2) RGB 函数 ， 定 义 为 “rgb(red,green.blue)”， 变 量 red、green、blue 的 取 值 为 [0,255] 范 围 的 整数 。 另 
外 ， 颜 色 值 也 可 以 为 [0%,100%] 的 三 个 百分比 。 例 如 ，“rgb(255,0,0)” 和 “rgb(100%,0%,0%)” 都 表示 纯 
红色 。 

(3) HSL(Hue, Saturation, Lightness) 函 数 ， 定 义 为 “hsl(hue,saturation%,lightness%)”。 变 量 hue 取 值 为 
[0,360]， 一 个 角度 表示 颜色 (red=0,green=120,blue=240); 变量 saturation 取 值 为 [0%,100%](gray=0%,full 
color=100%); 变量 lightness 取 值 为 [0%,100%](black=0%,normal=50%,white=100%)。 例 如 ，“hsl(0,100%， 
50%)” 为 纯 红色 。 

(4) 通用 HIML 颜色 名 称 , ImageDraw 模块 提供 了 140 个 标准 颜色 名 称 , X Window 系统 和 大 多 数 Web 
浏览 器 都 支持 这 些 颜 色 。 颜 色 名 称 对 大 小 写 不 敏感 ， 例 如 ，“red” 和 “Red” 都 表示 纯 红色 。 

4) Fonts 

PIL 可 以 使 用 Bitmap 字体 或 者 OpenType/TrueType 字体 。 

Bitmap 字体 被 存储 在 PIL 自己 的 格式 中 。 它 一 般 包 括 两 个 文件 : 一 个 叫 作 .pil， 包 含 字 体 的 矩阵 另 一 
个 通常 叫 作 pbm， 包 含 栅 格 数据 。 

在 ImageFont 模块 中 ， 使 用 函数 load0 加 载 一 个 Bitmap 字体 。 

在 ImageFont 模块 中 ， 使 用 函数 tuetype0 加 载 一 个 OpenType/TrueType 字体 。 

注意 : 这 个 函数 依赖 于 第 三 方 库 ， 而 且 并 不 是 在 所 有 的 PIL 版 本 中 都 有 效 。 
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(IonPIL) 加 载 内 置 的 字体 ， 使 用 ImageFont 模块 的 Font0 结 构 函 数 即 可 。 


2. ImageDraw 模块 的 函数 

Draw(image) 僵 Draw instance 

创建 一 个 可 以 在 给 定 图 像 上 绘图 的 对 象 。 

(IonPIL) 用 户 可 以 使 用 ImageWin 模块 的 HWND 或 者 HDC 对 象 来 代替 图 像 。 人 允许 用 户 直 接 在 屏幕 上 


EASE 


注意 : 图 像 内 容 将 会 被 修改 。 

下 面 给 出 一 段 关于 Draw 的 实例 ， 具 体 代码 如 下 。 

>>>fromPIL import Image, ImageDraw 

>>> im01 =Image.open("D://Code//Python//test//img//test01.jpg") 
>>> draw =ImageDraw.Draw (im01) 

>>> draw.line((0,0) +im01.size, fill=128) 


>>> draw.line((0,im01. 


>>> im01.show() 
>>> del draw 


size[1], im.size[0], 0), fill = 128) 


在 图 像 上 绘制 了 两 条 灰色 的 对 角 线 。 
3. ImageDraw 模块 的 方法 


1) arc 


draw.arc(xy,start,end,options) 

在 给 定 的 区 域内 ， 在 开始 和 结束 角度 之 间 绘 制 一 条 弧 〈 圆 的 一 部 分 )。 
变量 options 中 fl 设置 弧 的 颜色 。 

下 面 给 出 一 段 关于 arc 的 实例 ， 具 体 代码 如 下 。 

>>> from PIL import Image,ImageDraw 


>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>> draw =ImageDraw.Draw (im01) 


>>> draw.arc((0,0,200, 


200),0, 90, fill = (255,0,0)) 


>>>draw.arc( (300,300,500,500), 0, -90, fill = (0,255,0)) 


>>> draw.arc((200,200, 


>>> im01.show() 
>>> del draw 


300,300),-90, 0, fill = (0,0,255)) 


注意 : 变量 xy 是 需要 设置 一 个 区 域 ， 此 处 使 用 4 元 组 ， 包 含 区 域 的 左上 角 和 右 下 角 两 个 点 的 坐标 。 在 
此 PIL 版 本 中 , 变量 options 不 能 使 用 outline, 会 报错 : “TypeError: arc() got an unexpected keyword argument 
'outline'”;， 所 以 此 处 应 该 使 用 fill。 


在 图 像 上 (0,0,200,200) 


区 域 使 用 红色 绘制 了 90” 的 弧 , (300,300,500,500) 区 域 使 用 绿色 绘制 了 270° 


的 弧 , (200,200,300,300) 区 域 使 用 蓝 色 绘制 了 90” 的 弧 。 这 些 弧 都 是 按照 顺 时 针 方 向 绘制 的 。 变量 start/end 
的 0" 为 水 平 向 右 ， 沿 着 顺 时 针 方向 依次 增加 。 


2) bitmap 


draw.bitmap(xy,bitmap,options) 

在 给 定 的 区 域 里 绘制 变量 bitmap 所 对 应 的 位 图 ， 非 零 部 分 使 用 变量 options 中 fill 的 值 来 填充 。 变 量 
bitmap 位 图 应 该 是 一 个 有 效 的 透明 模板 〈 模 式 为 1) 或 者 蒙 版 〈 模 式 为 工 或 者 RGBA)。 

这 个 方法 与 Image.paste(xy,color,bitmap) 有 相同 的 功能 。 


下 面 给 出 一 段 关 于 bitmap 的 实例 ， 具 体 代 码 如 下 。 

>>> from PIL import Image, ImageDraw 

>>> im01 =Image.open("D://Code//Python//test//img//test01.jpg") 
>>> im02 =Image.open("D://Code//Python//test//img//test02.jpg") 
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>>> im =im02.resize(300,200) >>> im.size 
(300，200) 

>>> rgb =im.split() 

>>> draw =ImageDraw.Draw (im01) 
>>>draw.bitmap((0,0), r, fill = (255,0,0)) 
>>>draw.bitmap((300,200), g, fill = (0,255,0)) 
>>>draw.bitmap( (600,400), b, fill (0,0,255)) 
>>> im01.show() 


变量 xy 是 变量 bitmap 对 应 位 图 起 始 的 坐标 值 ， 而 不 是 一 个 区 域 。 
3) chord 


draw.chord(xy,start,end,options) 

和 方法 arc0 一 样 ， 但 是 使 用 直线 连接 起 始点 。 

变量 options 的 outline 给 定 弦 轮 廓 的 颜色 ，fl 给 定 弦 内 部 的 颜色 。 

下 面 给 出 一 段 关 于 chord 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>> im01 =Image.open("D://Code//Python//test//img//test01.jpg") 
>>> draw =ImageDraw.Draw(im01l) 

>>> draw.chord((0,0,200,200),0, 90, fill = (255,0,0)) 

>>> draw.chord((300,300,500,500), 0, -90, fill = (0,255,0)) 


>>> draw.chord((200,200,300,300), -90, 0, fill = (0,0,255)) 
>>> im01.show() 


4) ellipse 

draw.ellipse(xy,options) 

在 给 定 的 区 域 绘制 一 个 椭圆 形 。 

变量 options 的 outline 给 定 椭圆 形 轮廓 的 颜色 ，fl 给 定 椭圆 形 内 部 的 颜色 。 
下 面 给 出 一 段 关 于 ellipse 的 实例 ， 具 体 代 码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>> im01 =Image.open("D://Code//Python//test//img//test01.jpg") 

>>> draw =ImageDraw.Draw (im01) 

>>> draw.ellipse((0,0, 200, 200), fill = (255, 0, 0)) 

>>> draw.ellipse((200,200,400,300),fill = (0, 255, 0)) 
>>>draw.ellipse ( (400, 400, 800, 600), fill = (0, 0, 255)) 

>>> im01.show() 

5) line 

draw.line(xy,options) 

在 变量 xy 列表 所 表示 的 坐标 之 间 画 线 。 

坐标 列表 可 以 是 任何 包含 二 元 组 [(x,y)…] 或 者 数字 [x,y,…] 的 序列 对 象 。 它 至 少 包 括 两 个 坐标 。 
变量 options 的 fil 给 定 线 的 颜色 。 

(1.1.5 版 新 加 ) 变量 options 的 width 给 定 线 的 宽度 。 注 意 线 连 接 不 是 很 好 ， 所 以 多 段 线段 连接 不 好 看 。 
下 面 给 出 一 段 关于 line 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>>draw = ImageDraw.Draw (im01) 

>>>draw.1line([(0,0), (100,300), (200,500)], fill = (255,0,0), width = 5) 


>>>draw.1line([50,10,100,200,400,300], fill = (0,255,0), width = 10) 
>>>im01.show() 


6) pieslice 


draw.pieslice(xy,start,end,options) 
和 方法 are0 一 样 ， 但 是 在 指定 区 域内 结束 点 和 中 心 点 之 间 绘 制 直线 。 
变量 options 的 fl 给 定 pieslice 内 部 的 颜色 。 
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下 面 给 出 一 段 关 于 pieslice 的 实例 ， 具 体 代 码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>>draw = ImageDraw.Draw (im01) 

>>>draw.pieslice((0,0,100,200), 0, 90, fill = (255,0,0)) 
>>>draw.pieslice((100,200,300,400), 0, -90, fill = (0,255,0)) 
>>> im01.show() 


7) point 

draw.point(xy,options) 

在 给 定 的 坐标 点 上 画 一 些 点 。 

标 列表 是 包含 二 元 组 [(x,y),…] 或 者 数字 [x,y,…] 的 任何 序列 对 象 。 
变量 options 的 fil 给 定点 的 颜色 。 

F 面 给 出 一 段 关 于 point 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>>draw = ImageDraw.Draw(im01) 

>>> draw.point ([(0,0), (100,150), (110, 50)], fill = (255, 0, 0)) 


>>> draw.point([0,10,100,110, 210, 150], fill = (0, 255, 0)) 
>>>im01.show() 


8) polygon 
draw.polygon(xy,options) 
绘制 一 个 多 边 形 。 
多 边 形 轮廓 由 给 定 坐标 之 间 的 直线 组 成 ， 在 最 后 一 个 坐标 和 第 一 个 4 
边 形 。 
坐标 列表 是 包含 二 元 组 [(x,y),…] 或 者 数字 [x,y,…] 的 任何 序列 对 象 。 它 最 少 包括 三 个 坐标 值 。 
变量 options 的 fil 给 定 多 边 形 内 部 的 颜色 。 
下 面 给 出 一 段 关于 polygon 的 实例 ， 具 体 代码 如 下 。 
>>>from PIL import Image, ImageDraw 
>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>>draw = ImageDraw.Draw (im01) 
>>> draw.polygon([(0,0), (100,150), (210, 350)], fill = (255, 0, 0)) 


>>> draw.polygon([300,300,100,400, 400, 400], fill = (0, 255, 0)) 
>>>im01.show() 


* 标 间 增 加 了 一 条 直线 ， 形 成 多 


9) rectangle 


draw.rectangle(box,options) 

绘制 一 个 长 边 形 。 

变量 box 是 包含 二 元 组 [(x,y),…] 或 者 数字 [x,y,…] 的 任何 序列 对 象 。 它 应 该 包括 两 个 坐标 值 。 
注意 : 当 长 方形 没有 没有 被 填充 时 ,第 二 个 坐标 对 定义 了 一 个 长 方形 外 面 的 点 。 
变量 options 的 fil 给 定 长 边 形 内 部 的 颜色 。 

下 面 给 出 一 段 关于 rectangle 的 实例 ， 具 体 代 码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 

>>>draw = ImageDraw.Draw (im01) 

>>>draw.rectangle((0,0,100,200), fill = (255,0,0)) 

>>> draw.rectangle ([100,200,300,500] ,fill = (0,255,0)) 


>>>draw.rectangle([(300,500), (600,700)], fill = (0,0,255)) 
>>>im01.show() 


10) text 
draw.text(position,string,options) 
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方法 


在 给 定 的 位 置 绘制 一 个 字符 创 。 变 量 position 给 出 了 文本 的 左上 角 的 位 置 。 

变量 option 的 font 用 于 指定 所 用 字体 . 它 应 该 是 类 ImangFont 的 一 个 实例 , 使 用 ImageFont 模块 的 load0 
从 文件 中 加 载 的 。 

变量 options 的 名 1 给 定 文本 的 颜色 。 

下 面 给 出 一 段 关 于 text 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 

>>>draw = ImageDraw.Draw (im01) 


>>> draw.text((0,0),"Hello", fill = (255,0,0)) 
>>>im01.show() 


11) textsize 

draw.textsize(string,options)—>(width,height) 

返回 给 定 字符 串 的 大 小 ， 以 像素 为 单位 。 

变量 option 的 font 用 于 指定 所 用 字体 . 它 应 该 是 类 ImangFont 的 一 个 实例 ,使 用 ImageFont 模块 的 load0 


方法 从 文件 中 加 载 的 。 


下 面 给 出 一 段 关 于 textsize 的 实例 ， 具 体 代码 如 下 。 

>>>from PIL import Image, ImageDraw 

>>>im01 = Image.open("D://Code//Python//test//img//test01.jpg") 
>>>draw = ImageDraw.Draw(im01) 

>>>draw.textsize ("Hello") 

(30, 11) 

>>>draw.textsize ("Hello, the world") 

(96, 11) 

>>>im01.show () 


4. ImageDraw 模块 的 option 变量 
Option 变量 有 三 个 属性 ， 分 别 为 outline、f 和 font。outline 和 fl 都 可 为 整数 或 者 元 组 ，font 为 ImageFont 


类 的 实例 。 


12.2 ”使 用 Pillow 库 处 理 图 片 举例 


通过 前 面 的 学 习 相信 读者 对 Pillow 库 已 经 非常 熟悉 了 ， 本 节 通 过 不 同 的 三 个 实际 案例 熟悉 Pillow 库 在 


实际 开发 中 的 应 用 。 


12.2.1 图 片 格式 转换 


在 数字 图 像 处 理 中 ， 针 对 不 同 的 图 像 格式 有 其 特定 的 处 理 算法 。 所 以 ， 在 做 图 像 处 理 之 前 ， 需 要 考虑 


清楚 自己 要 基于 哪 种 格式 的 图 像 进行 算法 设计 及 其 实现 。 本 节 基 于 这 个 需求 ， 使 用 Python 中 的 图 像 处 理 库 
Pillow 来 实现 不 同 图 像 格 式 的 转换 。 
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下 面 给 出 一 段 代码 实现 图 片 格式 转换 ， 具 体 如 下 。 


# 将 jpg 格式 转 为 png 

import os 

from PIL import Image 

import shutil 

import sys 

#Define the input and output image 
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output dirHR = '../data/Mosaic HR/' 
output dirLR = -/data/Mosaic LR/' 
if not os.path.exists (output dirHR): 
os .mkdir (output dirHR) 
if not os.path.exists (output dirLR): 
os.mkdir (output dirLR) 
def image2png (dataset dir,type): 
files = rn 
image list = os.listdir(dataset dir) 
files = [os.path.join(dataset dir, ) for _ in image list] 
for index,jpg in enumerate (files): 
if index > 100000: 
break 
try: 
Sys.stdout .write('\r>>Converting image %d/100000 ' $% (index)) 
sys.stdout.flush() 
im = Image.open (jpg) 
png = os.path.splitext (jpg) [0] + "." + type 
im.save (png) 


+ 将 已 经 转换 的 图 片 移动 到 指定 位 置 


if jpg.split('.') [-1] == 'Jpg' 
shutil.move (png,output_dirLR) 
else: 
shutil.move (png, output_ dirHR) 
0 
shutil.move (png, output dirHR) 
except IOError as e: 
print('could not read:',jpg) 
print('error:',e) 
print ('skip it\n') 
sys.stdout .write('Convert Over!\n') 
sys.stdout.flush() 
if name ==" main ": 
current dir = os.getcwd!() 
Print (current dir) #/Users/gavin/Pycharmprojects/pygame 
data dir = '/home/gavin/MyProject/python/nesunai faces/' 
image2png (data_dir, 'png') 


12.2.2 ”批量 生成 缩 略 图 


在 网 页 中 通常 会 有 缩 略 图 的 使 用 ， 将 原 图 缩 略 后 用 于 标题 展示 ， 这 样 就 减少 了 使 用 工具 操作 图 片 。 
下 面 给 出 一 个 实例 ， 默 认 仅 操 作 当 前 文件 夹 中 的 所 有 jpg 图 像 ， 默 认 缩 略 图 大 小 128 x 128， 具 体 代码 
如 下 。 


from PIL import Image 
import glob,os,sys 
class fromFile2thumbnails (object) : 
def _init (self,fileDir = sys.path[0],format ='jpg',size = (128,128)): 
self. fileDir = fileDir 
self. size = size 
self. format = format 
self. filepath = os.path.join(fileDir, '*.'+format) 
self. thumbpath = os.path.join (fileDir, 'thumb') 
def run(self) : 
if not os.path.exists(self. thumbPath) : 
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以 上 代码 会 在 文件 夹 中 建立 一 个 thumb 文件 夹 ， 并 生成 缩 略 图 。 


12.2.3 ”为 图 片 添加 Logo 


为 图 片 添加 Logo 使 用 的 方法 是 图 片 合并 ， 通 过 两 种 不 同 图 片 合成 一 张 新 的 图 片 。 
下 面 给 出 一 个 完整 的 实例 代码 。 
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lw, lh = logoim.size 
baseim.paste (logoim, (bw-lw, bh-1h)) 
baseim.save ('test3.jpg', 'JPEG') 
print ('logo 水 印 组 合成 功 ') 


def text watermark(img, text, out file="test4.jpg", angle=23, opacity=0.50): 


# 添 加 一 个 文字 水 印 , 做 成 透明 水 印 的 模样 ,使 用 png 图 层 合并 
watermark = Image.new('RGBA', img.size, (255,255,255)) 寺 这 里 有 一 层 白 色 的 膜 ,去 掉 (255,255， 
255) 这 个 参数 就 好 了 


FONT = "msyh.ttfn 
Sizer = 之 
n_font = ImageFont.truetype (FONT, size) ## 得 到 字体 


n width, n height = n_font.getsize (text) 
text box = min(watermark.size[0], watermark.size[1]) 
while (n width+n height < text box): 


Se 
n font = ImageFont.truetype (FONT, size=size) 
n width, n height = n font.getsize(text) ## 文 字 逐 渐 放 大 , 但 是 要 小 于 图 片 的 宽 高 最 小 值 


text width = (watermark.size[0] - n width) / 2 
text height = (watermark.size[1] - n height) / 2 
#watermark = watermark.resize((text width,text height), Image.ANTIALIAS) 
draw = ImageDraw.Draw (watermark, 'RGBA') # 在 水 印 层 加 画笔 
draw.text ((text width, text height), 
text, font=n font, fill="#21ACDA") 
watermark = watermark.rotate (angle, Image.BICUBIC) 
alpha = watermark.split() [3] 
alpha = ImageEnhance.Brightness (alpha) .enhance (opacity) 
watermark.putalpha (alpha) 
Image .composite (watermark, img, watermark) .save(out file, 'JPEG') 
print ("文字 水 印 成 功 ") 
#4 等 比例 压缩 图 片 


def resizeImg (img, dst w=0, dst h=0, qua=85): 


只 给 了 宽 或 者 高 ,或 者 两 个 都 给 了 ,然后 取 比 例 合适 的 
如 果 图 片 比 给 要 压缩 的 尺寸 都 要 小 ,就 不 压缩 了 
0 
ori w, ori h = im.size 
widthRatio = heightRatio = None 
ratio = 1 
if (ori wand ori w > dst w) or (ori h and ori h > dst h): 
if dst w and ori w > dst_w: 
widthRatio = float(dst WwW) / oriw # 正 确 获 取 小 数 的 方式 
if dst h and ori h > dst_h: 
heightRatio = float(dst h) / ori h 
if widthRatio and heightRati 
if widthRatio < heightRatio: 
ratio = widthRatio 
else: 
ratio = heightRatio 
if widthRatio and not heightRatio: 
Fatio = widthRatio 
if heightRatio and not widthRatio: 
ratio = heightRatio 
newWidth = int(ori w * ratio) 
newHeight = int(ori h * ratio) 
else: 
newWidth = ori W 
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12.3 ”就 业 面试 技巧 与 解析 


图 像 处 理 在 实际 开发 中 是 有 侧重 点 的 ， 如 果 是 网 络 开发 可 能 更 多 的 是 侧重 于 资源 图 像 的 处 理 ， 例 如 ， 
处 理 图 像 大 小 、 缩 放 等 。 而 在 客户 端 程序 中 更 多 地 侧重 于 控件 自 绘 上 ， 因 此 在 面试 中 应 理解 面试 官 的 真正 


12.3.1 ”面试 技巧 与 解析 (一) 


面试 官 : 什么 是 Pillow 库 ? 
应 聘 者 : Pillow 是 PIL (Python 图 形 库 ) 的 一 个 友好 分 支 。 对 于 用 户 比 PLL 更 加 友好 ， 对 于 任何 在 图 形 
领域 工作 的 人 是 必 备 的 库 。 


12.3.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : 如 何 使 用 Pillow 实现 图 像 缩放 ? 

应 聘 者 : 在 Pillow 中 图 片 的 缩放 有 以 下 两 种 方式 。 

(1) 使 用 resize 函数 。 

(2) 使 用 thumbnail 函数 。 

resize 函数 可 以 缩小 ， 也 可 以 放大 。 

thumbnail 只 能 缩小 ， 不 能 放大 ， 所 以 如 果 只 打开 一 次 图 片 ， 要 存 出 多 个 尺寸 的 话 ， 要 么 从 大 到 小 开始 

或 者 使 用 resize 从 大 到 小 开始 缩放 ， 因 为 用 resize 放大 的 话 ， 可 以 想象 那个 马赛 克 。 

当然 ,也 可 以 设置 缩放 图 片 的 质量 (PIL.ImageNEAREST: 最 低 质量 ，PIL.Image.BILINEAR: 双 线 性 ; 
PIL.Image.BICUBIC: 三 次 样 条 插值 ，Image.ANTIALIAS: 最 高 质量 )。 
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第 13 章 
正则 表达 式 


> 学 学 习 指 引 


正则 表达 式 (Regular Expression，RE)， 在 代码 中 一 般 简写 为 regex、regexp 或 re。 正 则 表达 式 是 由 一 
些 由 字符 和 特殊 符号 组 成 的 字符 串 。 正 则 表达 式 为 高 级 的 文本 模式 匹配 、 抽 取 、 与 /或 文本 形式 的 搜索 和 替 
换 功 能 提供 了 基础 。 


二 ”重点 导读 


“掌握 正则 表达 式 基本 元 字符 的 用 法 。 
“掌握 re 模块 中 各 函数 的 用 法 。 

。 分 组 匹配 与 索引 的 使 用 。 

“掌握 扩展 字符 的 用 法 。 

。 就 业 面试 技巧 与 解析 。 


13.1 正则 表达 式 基础 


正则 表达 式 并 不 是 Python 的 一 部 分 ， 而 是 嵌入 Python 的 微小 的 、 高 度 专业 化 的 语言 ， 可 以 通过 re 模 
块 访问 。 正 则 表达 式 是 用 于 处 理 字符 串 的 强大 工具 ， 拥 有 自己 独特 的 语法 以 及 一 个 独立 的 处 理 引擎 ， 功 能 
十 分 强大 。 正 则 表达 式 主要 是 针对 字符 串 进行 操作 ， 可 以 简化 对 字符 串 的 复杂 操作 ， 其 主要 功能 有 匹配 、 
切割 、 替 换 、 获 取 。 在 提供 了 正则 表达 式 的 语言 里 ， 正 则 表达 式 的 语法 都 是 一 样 的 ， 区 别 只 在 于 不 同 的 编 
程 语言 实现 支持 的 语法 数量 不 同 。 如 果 已 经 在 其 他 语言 中 学 过 正则 表达 式 的 使 用 ， 只 需要 简单 看 看 就 可 以 
轻松 应 用 了 。 
为 什么 使 用 正则 表达 式 ? 
典型 的 搜索 和 替换 操作 要 求 用 户 提供 与 预期 的 搜索 结果 匹配 的 确切 文本 。 虽 然 这 种 技术 对 于 对 静态 文 
本 执行 简单 搜索 和 替换 任务 可 能 已 经 足够 了 ， 但 它 缺 乏 灵活 性 。 若 采用 这 种 方法 搜索 动态 文本 ， 即 使 不 是 
不 可 能 ， 至 少 也 会 变 得 很 困难 。 
通过 使 用 正则 表达 式 ， 可 以 : 


(1 
例 


第 芍 章 正则 表达 式 


) 测试 字符 串 内 的 模式 。 
如 ， 可 以 测试 输入 字符 串 ， 以 查看 字符 串 内 是 否 出 现 电话 号 码 模式 或 信用 卡号 码 模式 。 这 称 为 数据 


(2) 替换 文本 。 


可 


(3 


例 
以 使 用 


缩小 到 
使 用 正 


正 


地 方 ， 


13.2. 


正 


以 使 用 正则 表达 式 来 识别 文档 中 的 特定 文本 ， 完 全 删除 该 文本 或 者 用 其 他 文本 替换 它 。 

) 基于 模式 匹配 从 字符 串 中 提取 字符 串 。 

以 查找 文档 内 或 输入 域内 特定 的 文本 。 

如 ， 可 能 需要 搜索 整个 网 站 ， 删 除 过 时 的 材料 ， 以 及 替换 某 些 HTML 格式 标记 。 在 这 种 情况 下 ， 可 
正则 表达 式 来 确定 在 每 个 文件 中 是 否 出 现 该 材料 或 该 HTML 格式 标记 。 此 过 程 将 受 影响 的 文件 列表 
包含 需要 删除 或 更 改 的 材料 的 那些 文件 。 然 后 可 以 使 用 正则 表达 式 来 删除 过 时 的 材料 。 最 后 ， 可 以 
则 表达 式 来 搜索 和 替换 标记 。 


13.2 正则 表达 式 基 本 元 字符 


则 表达 式 最 常见 的 特殊 符号 和 字符 ， 即 所 谓 的 元 字符 。 元 字符 是 使 用 正则 表达 式 不 同 于 普通 字符 的 
也 是 正则 表达 式 能 够 发 挥 强大 作用 、 具 有 强大 表达 能 力 的 法 宝 。 


1 正则 表达 式 元 字符 
则 表达 式 语言 由 两 种 基本 字符 类 型 组 成 : 原 义 〈 正 常 ) 文本 字符 和 元 字符 。 元 字符 使 正则 表达 式 具 


有 处 理 能 力 。 元 字符 既 可 以 是 放 在 [0 中 的 任意 单个 字符 (如 [a] 表 示 匹 配 单个 小 写字 符 a)， 也 可 以 是 字符 序 


列 (如 
所 示 是 


[a-d] 表 示 匹 配 a、b、c、d 中 的 任意 一 个 字符 ， 而 \w 表示 任意 英文 字母 和 数字 及 下 画 线 )， 如 表 13-1 
一 些 常见 的 元 字符 。 


表 13-1 正则 表达 式 元 字符 


字符 描述 
5 匹配 除 以 外 的 任何 字符 (注意 元 字符 是 小 数 点 ) 
[abcde] 匹配 abcde 之 中 的 任意 一 个 字符 
[a-h] 匹配 a~h 中 的 任意 一 个 字符 
[feh] 不 与 fgh 之 中 的 任意 一 个 字符 匹配 
Ww 匹配 大 小 写 英文 字符 及 数字 0~9 中 的 任意 一 个 及 下 画 线 ， 相 当 于 [a-zA-Z0-9 ] 
WwW 不 匹配 大 小 写 英文 字符 及 数字 0~9 中 的 任意 一 个 ， 相 当 于 [^a-zA-Z0-9_] 
NE 匹配 任何 空白 字符 ， 包 括 空 格 、 制 表 符 、 换 页 符 等 。 等 价 于 [ftwv]。 注 意 : Unicode 正则 表达 式 会 
匹配 全 角 空 格 符 
\S 匹配 任何 非 空 白字 符 。 等 价 于 [Afmwtwv] 
上 匹配 一 个 制 表 符 。 等 价 于 \xO9 和 \cl 
Ww 匹配 一 个 垂直 制 表 符 。 等 价 于 wwOb 和 \cK 
Ad 匹配 任何 0~9 中 的 单个 数字 ， 相 当 于 [0-9] 
D 不 匹配 任何 0~9 中 的 单个 数字 ， 相 当 于 [^0-9] 
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匹配 一 个 单词 边界 ， 也 就 是 指 单词 和 空格 间 的 位 置 。 例 如 ，erb 可 以 匹配 mever" 中 的 er， 但 不 能 匹 
配 "verb" 中 的 ‘er 


B | 匹配 非 单词 边界 。'enB' 能 匹配 "verb" 中 的 “er， 但 不 能 匹配 "mever" 中 的 er 

羡 匹配 由 x 指明 的 控制 字符 . 例如 , eM 匹配 一 个 Ci+M 或 回 车 符 , x 的 值 必须 为 A~Z 或 a~z 之 一 。 
否则 ， 将 c 视 为 一 个 原 义 的 字符 

¥ | 匹配 一 个 换 页 符 。 等 价 于 w0c 和 vcL 

加 | 匹配 一 个 换行 符 。 等 价 于 w0a 和 veJ 


13.2.2 正则 表达 式 限定 符 


上 面 的 元 字符 都 是 针对 单个 字符 匹配 的 ， 要 想 同 时 匹配 多 个 字符 的 话 ， 还 需要 借助 限定 符 。 如 表 13-2 
所 示 是 一 些 常见 的 限定 符 ( 表 中 n 和 m 都 是 表示 整数 ， 并 且 0<n<m)。 


表 13-2 ”正则 表达 式 限定 符 


字符 描述 
匹配 输入 字符 串 的 结束 位 置 。 如 果 设 置 了 RegExp 对 象 的 Multiline 属性 , 则 $ 也 匹配 n 或 \r。 要 匹配 字 
符 本 身 ， 请 使 用 \$ 
0 将 位 于 0 内 的 内 容 当 作 一 个 整体 
0 按 们 中 的 次 数 进行 匹配 
匹配 位 于 * 之 前 的 0 个 或 多 个 字符 
? 匹配 位 于 ?之 前 的 0 个 或 一 个 字符 
\ 表示 位 于 \ 之 后 的 为 转 义 字符 。 如 匹配 字符 "nr'。"\n\ 匹 配 换 行 符 
^ 匹配 输入 字符 串 的 开始 位 置 ， 除 非 在 方 括 号 表达 式 中 使 用 ， 此 时 它 表示 不 接受 该 字符 集合 
十 匹配 位 于 + 之 前 的 一 个 或 多 个 字符 
| 匹配 位 于 | 之 前 或 者 之 后 的 字符 
{n} n 是 一 个 非 负 整 数 。 匹 配 确 定 的 n 次 
{n.} n 是 一 个 非 负 整数 。 至 少 匹 配 n 次 
{nm} m 和 n 均 为 非 负 整 数 ， 其 中 ，n<m。 最 少 匹 配 n 次 且 最 多 匹配 m 次 
xy 匹配 x 或 者 y 


13.2.3 ”正则 表达 式 元 字符 举例 


正则 表达 式 的 最 简单 形式 是 在 搜索 字符 串 中 匹配 其 本 身 的 单个 普通 字符 。 例 如 ， 单 字符 模式 ， 如 A， 不 
论 出 现在 搜索 字符 串 中 的 何 处 ， 它 总 是 匹配 字母 A。 下 面 是 一 些 单字 符 正 则 表达 式 模式 的 实例 : /a/、 /5/、/B/。 
还 可 以 将 许多 单字 符 组 合 起 来 以 形成 大 的 表达 式 ， 例 如 ，/a5B/ 正 则 表达 式 组 合 了 单字 符 表达 式 a、5、B。 

句点 (.) 匹配 字符 串 中 的 各 种 打印 或 非 打 印字 符 ， 只 有 一 个 字符 例外 。 这 个 例外 就 是 换行 符 (\n)。/a.c/ 
正则 表达 式 匹 配 aac、abc、acc、ade 等 ， 以 及 alc、a2c、a-c 和 a#c。 若 要 匹配 包含 文件 名 的 字符 串 ， 而 句 
点 (.) 是 输入 字符 串 的 组 成 部 分 , 在 正则 表达 式 中 的 句点 前 面 加 反 斜 杠 (\) 字符 。 举例 来 说 明 , /filename/.ext/ 
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行 定位 符 “^” 表 示 行 的 开始 ,“$” 表 示 行 的 结束 。 例如 ,“^Python” 能 
“喜欢 $ ”能够 匹配 字符 串 “ 我 很 喜欢 ”的 末尾 ， 但 是 不 能 匹配 
。“^” 在 方 括号 “中 ”中 使 用 时 ， 表 示 的 是 不 接受 该 字符 集合 ， 例 如 ,，“[^a-z]” 匹 配 任何 不 


的 开始 ， 但 是 不 能 匹配 “我 会 用 Python”; 
“我 很 喜欢 你 
在 a~z 范围 内 的 任意 字符 。 


元 字符 “[]” 表 示 匹 配 括号 中 的 任何 一 个 字符 ， 例 如 ,“b[aulg” 可 以 
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匹配 字符 串 “python 我 会 用 ” 


匹配 “bag”“bug” 但 是 不 能 匹配 


“big”“baug”。 另 外 ， 在 “[]” 中 还 可 以 使 用 “-” 来 表示 某 一 范围 ， 例 如 ,“[0-9]” 表 示 从 “0” 到 “9” 


的 所 有 数字 ， 所 以 “a[0-9]c” 等 价 于 “af[0123456789]c”， 就 可 以 匹配 “a0c”“alc”… 


“a9c” 等 多 个 字 


符 串 。 还 可 以 指定 多 个 区 间 ， 例 如 ,“[a-zA-Z0-9]” 表 示 任 意 的 字母 和 数字 。 
元 字符 “|” 将 两 个 匹配 条 件 进行 远 辑 “或 ” (Or) 运算 。 例如， 正则 表达 式 (himlher) 匹 配 "it belongs to 
him" 和 "it belongs to her"， 但 是 不 能 匹配 "it belongs to them."。 注 意 : 这 个 元 字符 不 是 所 有 的 软件 都 支持 的 。 


元 字符 “fn}、{n,}、{m,m} ”表示 匹配 指定 数目 的 字符 ， 这 些 字符 是 在 它 之 前 的 表达 式 定义 的 。 例 如 
正则 表达 式 A[0-9]{3} 能 够 匹配 字符 "A" 后 面 跟 着 正好 3 个 数字 字符 的 串 ， 例 如 A123、A348 等 ， 但 是 不 


同 


配 A1234。 而 正则 表达 式 [0-9]{4,6} 匹配 连续 的 任意 4 个 、5 个 或 者 6 个 数字 。 
限定 符 “+” 表 示 匹 配 1 个 或 多 个 正好 在 它 之 前 的 那个 字符 。 例如， 正则 表达 式 9+ 匹 配 9、99、999 等 。 


注意 这 个 元 字符 不 是 所 有 的 软件 都 支持 的 。 


13.3 re 模块 


Python 通过 re 模块 提供 对 正则 表达 式 的 支持 。 通过 内 说 集成 re 模块 , 程序 员 们 可 以 直接 调用 来 实现 正 


则 匹配 ， re 模块 是 Python 提供 的 处 理 正则 表达 式 的 标准 库 。 使 用 re 的 一 般 步 骤 是 先 将 正则 表达 式 的 字符 囊 
形式 编译 为 Pattem 实例 ， 然 后 使 用 Pattem 实例 处 理 文本 并 获得 匹配 结果 (一 个 Match 实例 )， 最 后 使 用 


Match 实例 获得 信息 ， 进 行 其 他 的 操作 。 
如 表 13-3 所 示 是 常用 的 re 模块 函数 与 正则 表达 式 对 象 的 方法 。 


表 13-3 常见 正则 表达 式 属性 


函数 描 述 
compile(pattem, flags=0) 使 用 任何 可 选 的 标记 来 编译 正则 表达 式 的 模式 ,然后 返回 一 个 正则 表达 式 对 象 
尝试 使 用 带 有 可 选 标记 的 正则 表达 式 的 模式 来 匹配 字符 串 。 如 果 匹 配 成 功 ， 则 
人 返回 匹配 对 象 ， 如 果 失 败 就 返回 None 
| 使 用 可 选 标记 搜索 字符 串 中 第 一 次 出 现 的 正则 表达 式 模式 。 如 果 匹 配 成 功 ， 则 
人 返回 匹配 对 象 ， 如 果 失 败 就 返回 None 
findall(pattem,string flags) 查找 字符 串 中 所 有 “ 非 重 复 ) 出 现 的 正则 表达 式 模式 ， 并 返回 一 个 匹配 列表 
| | 与 fndall0 函 数 相同 ， 但 返回 的 不 是 一 个 列表 ， 而 是 一 个 迭代 器 。 对 于 每 一 次 
reter(pattemstiinp, fags) 匹配 ， 和 迭代 器 都 返回 一 个 匹配 对 旬 
根据 正则 表达 式 的 模式 分 隔 符 ，spItO 函 数 将 字符 串 分 割 成 列表 ， 然 后 返回 匹 
split(pattern.string.max=0) 


配 成 功 的 列表 ， 分 割 最 多 操作 max 次 ，max 默认 为 0 


sub(pattern.repl.string.count=0,flags=0) 


使 用 repl 替换 所 有 正则 表达 式 的 模式 在 字符 串 中 出 现 的 位 置 ，count 表示 最 大 
替换 次 数 ， 默 认为 0 


subn(pattern,repl.string.count=0,flags=0) 


subn0 函 数 除了 返回 被 蔡 换 后 的 字符 串 外 ， 还 会 返回 一 个 替换 次 数 ， 它 们 是 以 
元 组 的 形式 返回 的 
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如 表 13-4 所 示 是 re 模块 常用 的 匹配 方法 。 
表 13-4 常用 的 匹配 方法 


方 法 描述 
group(num=0) 匹配 整个 表达 式 的 字符 串 ，group0 可 以 一 次 处 理 多 个 组 号 ， 这 样 将 会 返回 一 个 包含 那些 组 对 应 的 元 组 
groups0) | 返回 一 个 包含 所 有 小 组 字符 串 的 元 组 ， 从 1 到 所 含 的 小 组 号 


groupdiet0) 返回 一 个 包含 所 有 匹配 的 命名 子 组 的 字典 ， 所 有 的 子 组 名 称 作为 字典 的 键 


13.3.1 正则 匹配 搜索 函数 


正则 匹配 搜索 函数 常用 的 主要 包含 三 个 re 函数 : match0 函 数 、search0 函 数 、findall0 函 数 。 

1. match() 函 数 

match(O 函 数 试图 从 字符 串 的 起 始 部 分 对 模式 进行 匹配 。 如 果 匹 配 成 功 则 返回 MatchObject 对 象 实例 ， 
如 果 不 是 起 始 位 置 匹配 成 功 的 话 ， 就 返回 None。 以 下 为 match0 函 数 的 语法 : 

Fe .match (pattern, string[,flags]) 

其 参数 含义 说 明 如 下 。 

。 pattem: 匹配 的 正则 表达 式 。 

。 string: 要 匹配 的 字符 串 。 

。 flags: 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 。 

flags 为 可 选 标识 ， 多 个 标识 可 以 通过 按 位 或 〈|) 来 指定 。 如 re | re.M 被 设置 成 I 和 M 标识 ， 常 用 标 
识 位 如 表 13-5 所 示 。 


表 13-5 常用 标识 位 属性 


匹配 对 大 小 写 不 敏感 
做 本 地 化 识别 匹配 
多 行 匹配 ， 影 响 “ 和 $ 
使 .匹配 包括 换行 在 内 的 所 有 字符 
reU 根据 Unicode 字符 集 解 析 字 符 。 这 个 标识 影响 w,，\W,，\b，\B 


TeX 该 标识 通过 给 予 更 灵活 的 格式 以 便于 将 正则 表达 式 变 得 更 易于 理解 


【 例 13-1】matchO 函 数 举例 。 


import re 


print (re.match('We', 'We are family') .span()) # 在 起 始 位 置 匹配 
print (re.match('are', 'We are family')) 堆 不 在 起 始 位 置 匹配 
程序 运行 结果 如 图 13-1 所 示 。 13-1 运行 结果 


例子 解析 : span0 函 数 返回 一 个 组 开始 和 结束 的 位 置 , “We” 位 于 字符 串 “We 
are family ”的 起 始 位 置 , 因为 match0 函 数 是 从 字符 串 的 起 始 位 置 开始 的 , 则 re.match0.span0 函 数 返 回 (0,2); 
而 “are” 不 在 字符 串 “We are famil y” 的 起 始 位 置 ， 所 以 match0 函 数 返 回 None。 
匹配 成 功 re.match 方法 返回 一 个 匹配 的 对 象 , 可 以 使 用 group(num) 或 groups0 匹 配对 象 函数 来 获取 匹配 
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表达 式 。group0 或 group(0)， 返 回 整个 正则 表达 式 的 匹配 结果 。 


象 的 实例 ， 否 则 返 


符 


【 例 13-2】matchO 函 数 运 用 group0 举 例 。 


import re 
s='abc123abc' 

print (re.match(' [a-z]+', 5s)) #<_sre.sRE Match object; span=(0, 3), match='abc'> 
print (re.match(' [a-z]+', 5).group(0)) # abc 

print (re.match('[\d]+', s)) # None 

print (re.match('[A-Z]+', 5, re.I).group(0)) # abc 

print(re.match('[a-z]+', 5).span()) # (0, 3) 

程序 运行 结果 如 图 13-2 所 示 。 

2. search() 函 数 图 13-2 运行 结果 
re.search0 函 数 扫描 整个 字符 串 并 返回 第 一 个 成 功 的 匹配 ， 匹 配 成 功 re.search 方法 返回 MatchObject 对 


器 


None。 以 下 为 searchO 函 数 的 语法 : 
re.search (Pattern, string[, flags]) 

其 参数 含义 说 明 如 下 。 

。 pattem: 匹配 的 正则 表达 式 。 

。 string: 要 匹配 的 字符 串 。 

。 flags: 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 。 
【 例 13-3】search0 函 数 举 例 。 


import re 
print (re.search('We', 'We are family') .span()) # 在 起 始 位 置 匹配 
print (re.search('are', 'We are family').span())  # 不 在 起 始 位 置 匹配 


程序 运行 结果 如 图 13-3 所 示 。 
例子 解 折 ， 和 mateh0 函 数 不 同 的 是 ，seareh0 卫 数 是 扫 措 整个 字 | 
,并 返回 第 一 个 成 功 的 匹配 , 所 以 “We” 在 字符 串 “We are family” 


中 起 始 位 置 为 0， 结束 位 置 为 2。“are” 在 字符 串 “We are family” 中 图 13-3 运行 结果 


起 始 位 置 为 3， 结 束 位 置 为 6。 


器 


匹配 成 功 re.search 方法 返 


器 


一 个 匹配 的 对 象 ， 否 则 返 


None。 可 以 使 用 group(num) 或 groups0 〇 匹配 对 


象 函数 来 获取 匹配 表达 式 。 


【 例 13-4】searchO 函 数 运用 group0 举 例 。 


import re 
5 = "abcl23abc' 


print (re.search('[a-z]+', 5).group()) # abc 
Print (re.search('[a-z]+', 5).span()) # (0, 3) 
Print (re.search('[\d]+', s).group()) # 123 
print (re.search('[\d]+', s).span()) ea oh 
print (re.search('xyz', 5)) # None 


程序 运行 结果 如 图 13-4 所 示 。 13-4 ”运行 结果 
3. compile() 函 数 
re.compile(O) 函 数 用 于 编译 正则 表达 式 ， 生 成 一 个 正则 表达 式 (Pattem) 对 象 ， 供 matchO0 和 searchO 这 两 


个 函数 使 用 。 以 下 为 compile0 函 数 的 语法 : 


compile (pattern, flags=0) 


参数 含义 说 明 如 下 。 
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。 pattermn: 匹配 的 正则 表达 式 。 
。 flags: 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 。 
【 例 13-5】compile0) 函 数 举例 。 


import re 
s="Python is a very easy to use programming language" 


p=re.compile (r'to') # 查 找 'to' 

print (p.match(s)) | 

print (p.search(s)) 

程序 运行 结果 如 图 13-5 所 示 。 图 13-5 运行 结果 

例子 解析 : re.compile(r'to”) 表 示 匹 配 字符 串 中 所 有 的 'to'， 
match0O 函 数 匹 配 字符 串 首部 ， 如 果 首 部 不 是 'to" 就 返回 None，search0 函 数 匹 配 整 个 字符 串 ， 只 要 存在 to 就 
返回 一 个 MatchObject 对 象 的 实例 。 

通过 上 述 运行 结果 可 以 看 出 ，matchO) 函 数 和 search0 函 数 是 有 非常 明显 的 区 别 的 ， 在 记忆 的 时 候 不 要 
出 错 。 

4. findall() 函 数 

re.findal0 函 数 在 字符 串 中 找到 正则 表达 式 所 匹配 的 所 有 子 串 ， 并 返回 一 个 列表 ， 如 果 没 有 匹配 成 功 ， 
则 返回 空 列表 。 以 下 为 fndall0 函 数 的 语法 : 

re.findall (pattern, string[, flags]) 

其 参数 含义 说 明 如 下 。 

。 pattem: 匹配 的 正则 表达 式 。 

。 string: 要 匹配 的 字符 串 。 

。 flags: 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 。 

【 例 13-6】findall0 函 数 举例 。 


import re 
5 = "abcl23def456" 
print (re.findall('[a-z]+', 5)) # ['abc', 'def'] 


print (re.findall('[0-9]+', 5)) # ['123',[456]] 
程序 运行 结果 如 图 13-6 所 示 。 | 
例子 解析 ，findall0 函 数 与 match0 和 search0 函 数 的 区 别 就 是 ， 前 者 是 匹配 13.6 运行 结果 
所 有 ， 后 两 者 就 只 匹配 一 次 。'[a-z]+' 表 示 匹 配 字符 串 中 所 有 的 小 写字 母 ， 匹 配 整 
个 字符 串 ， 所 以 输出 结果 为 abc' 和 'def'。'[0-9]+' 表 示 匹 配 字符 串 中 所 有 的 数字 ， 匹 配 整个 字符 串 ， 所 以 输出 
结果 为 '123') 和 '456'。 

【 例 13-7】findall0 函 数 举例 。 


import re 
string="abc 123 def 456" 
# 带 括号 与 不 带 括 号 的 区 别 


# 带 多 个 括号 
Pp=re.compile("((\w+) \s+\w+)") 
print (p.findall (string)) 

# 带 一 个 括号 
pl=re.compile("(\w+) \st\w+") 
print (pl.findall (string)) 

4# 不 带 括号 


p2=re.compile ("\wt\st+\w+") 
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print (p2.findall (string)) 
程序 运行 结果 如 图 13-7 所 示 。 


例子 解析 : 第 一 个 p 中 是 带 有 两 个 括号 的 ,可 以 看 到 其 输出 是 ” 4 

一 个 list 中 包含 两 个 tuple; 第 二 个 pl 中 带 有 一 个 括号 ， 其 输出 的 ep 

内 容 就 是 括号 匹配 到 的 内 容 ， 而 不 是 整个 表达 式 所 匹配 到 的 结果 ; 图 13.7 运行 结果 

第 三 个 p2 中 不 带 有 括号 ， 其 输出 的 内 容 就 是 整个 表达 式 所 匹配 到 

的 内 容 。findall0 返 回 的 是 括号 所 匹配 到 的 结果 (如 p1)， 多 个 括号 就 会 返 

〈 如 p)， 如 果 没有 括号 就 返回 整 条 语句 所 匹配 到 的 结果 (如 p2)。 
5.finditer() 函 数 
finditer0 函 数 和 findall0 函 数 类 似 ， 在 字符 串 中 查找 正则 表达 式 所 匹配 的 所 有 子 串 ， 并 把 它们 作为 一 个 

和 迭代 器 返回 。 以 下 为 finditer0 函 数 的 语法 : 
finditer(pattern，string，flags=0) 

其 参数 含义 说 明 如 下 。 

。 pattem: 匹配 的 正则 表达 式 。 

。 string: 要 匹配 的 字符 串 。 

。 flags: 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 。 

【 例 13-8】 提 取 所 有 邮箱 信息 (无 分 组 )。 


import re 

content = '''email:12345678@163.com 
email:2345678@163.com 
email:345678@163.com 


可 


回 


多 个 括号 分 别 匹 配 到 的 结 


可 


result finditer = re.finditer(r"\d+@\w+.com", content) 
# 由 于 返回 的 为 Matchobject 的 iterator, 所 以 需要 迭代 并 通过 Matchobject 的 方法 输出 
for i in result finditer : 
print (i.group()) 
result_findall = re.findall (r"\d+@\w+.com"，content) # 返 回 一 个 [] 直接 输出 or 或 者 循环 输出 
Print (result findall) 
for i in result findall : 
print (i) 


程序 运行 结果 如 图 13-8 所 示 。 


图 13-8 提取 所 有 邮箱 的 信息 


【 例 13-9】 提 取 所 有 的 号 码 和 邮箱 类 型 。 

import re 

content = '''email:12345678@163.com 

email:2345678@163.com 

email:345678@163.com 

result finditer = re.finditer(r"(\d+)@(\w+) .com", content) 


# 正 则 有 两 个 分 组 ,需要 分 别 获取 分 区 ,分 组 从 0 开始 , group 方法 不 传递 索引 默认 为 0, 代表 了 整个 正则 的 匹配 结果 
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for i in result finditer : 
print (i.group(1)+' '+i.group(2)) 

result findall = re.findall(r"(\d+)@(\Ww+) .com", content) 

print (result_ findall) 

# 此 时 返回 的 虽然 为 [] ,但 不 是 简单 的 [] ,而 是 一 个 tuple 类 型 的 1ist 

for i in result findall : 
print (i[0]+" "+i[1]) 


程序 运行 结果 如 图 13-9 所 示 。 


13.3.2 ”sub() 与 subn() 函 数 


Python 中 的 正则 表达 式 方面 的 功能 很 强大 , 其 
中 就 包括 re.sub0 和 re.subn0 函 数 , 实现 正则 的 替换 。 图 13-9 提取 所 有 的 号 码 和 邮箱 类 型 信息 
功能 很 强大 ， 所 以 导致 用 法 稍微 有 点 儿 复杂 ， 所 以 
当 遇 到 稍微 复杂 的 用 法 时 ， 就 容易 犯错 。sub0 和 subn0 一 样 ， 都 是 将 某 字符 串 中 所 有 匹配 正则 表达 式 的 部 
分 进行 某 种 形式 的 替换 ， 用 来 替换 的 部 分 通常 是 一 个 字符 串 ， 但 是 也 可 能 是 一 个 函数 ， 该 函数 返回 一 个 用 
来 替换 的 字符 串 。 但 是 subn0 还 返回 一 个 表示 替换 的 总 数 。 下 面 就 介绍 一 下 sub0 函 数 和 subn0 函 数 的 用 法 。 

sub0 函 数 用 于 替换 在 字符 串 中 符合 正则 表达 式 的 内 容 , 它 返回 替换 后 的 字符 串 。subn0 函 数 除了 返回 被 
替换 后 的 字符 串 ， 还 会 返回 一 个 替换 次 数 ， 它 们 是 以 元 组 的 形式 返回 的 。 以 下 为 两 个 函数 的 语法 : 

re.sub(pattern, repl, string, count=0, flags=0) 

re.subn (pattern, repl, string, count=0, flags=0) 


其 参数 含义 说 明 如 下 。 
。 pattermm: 表示 正则 表达 式 中 的 模式 字符 串 。 

。 repl: 就 是 replacement， 要 替换 成 的 内 容 。 

e string: 要 被 处 理 、 被 替换 的 字符 串 。 

。 count: 最 大 替换 次 数 ， 默 认 0 表示 替换 所 有 的 匹配 。 

。 flags: 为 标识 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 
【 例 13-10】sub0 和 subn0 〇 函数 的 区 别 。 


import re 
P = re.compile(r'(\w+) (\w+)') 
5 = 'i say, hello world!' 


def func (m) : 
return m.group (1) .title() + ' ' + .group(2) .title() 


print(p.sub(r'\2 \1', s)) 
print (p.sub (func, 5)) 


print (p.subn(r'\2 \1', 5)) 
print (p.subn (func, 5s)) 


程序 运行 结果 如 图 13-10 所 示 。 


13.3.3 split() 函 数 图 13-10 ”运行 结果 
split0 通 过 指定 分 割 符 对 字符 串 进行 切片 ， 如 果 参 数 num 有 指定 值 ， 则 分 割 num+l 个 子 字符 串 ， 以 下 
为 split0 函 数 的 语法 : 


re.split (pattern, string[,maxsplit=0]) 
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参数 含义 说 明 如 下 。 
。 pattern: 匹配 的 正则 表达 式 。 
。 string: 要 匹配 的 字符 串 。 
。 maxsplit: 最 大 分 割 次 数 ， 默 认为 0， 不 限制 次 数 。 
【 例 13-11】split0 函 数 的 应 用 。 
import re 
5="We are family" 
print (re.split(' '，vs) )# 使 用 空格 分 割 字符 串 , 只 要 有 空格 就 分 割 
str=re.split(' ',s,1) # 使 用 空格 分 割 字符 串 , 只 分 割 一 次 
for i in str: 
print (i) 
print (re.split ('r',s))# 使 用 'r' 分 割 字符 串 
程序 运行 结果 如 图 13-11 所 示 。 
除了 使 用 re 调用 split0 函 数 之 外 , 还 可 以 直接 利用 字符 串 调用 图 13-11 运行 结果 
split0， 语 法 为 ， 
str.split (str="", num=string.count (str) ) 
其 参数 含义 说 明 如 下 。 
。 str: 分 割 符 ， 默 认为 所 有 的 空 字符 ， 包 括 空 格 、 换 行 (mn)、 制 表 符 (t) 等 。 
。 num: 分 割 次 数 。 默 认为 0， 即 分 割 所 有 。 
【 例 13-12】 利 用 字符 串 调用 split0。 
5s="We are family" 
print(s.split(' ')) # 使 用 空格 分 割 字 符 串 ,只 要 有 空格 就 分 割 
print (s.split(' ',1)) +# 使 用 空格 分 割 字符 囊 , 只 分 割 一 次 
print (s.split ("a',1)) # 使 用 'r' 分 割 字符 串 , 分 割 一 次 
print (s.split ("a',2)) # 使 用 'r' 分 割 字符 串 , 分 割 两 次 


程序 运行 结果 如 图 13-12 所 示 。 


13.3.4 正则 表达 式 对 象 


Python 的 re 模块 包含 对 正则 表达 式 的 支持 。re 模块 提供 了 一 个 正则 表达 式 引擎 的 接口 ， 可 以 将 Res 编 
译 成 对 象 并 用 它们 来 进行 匹配 。 

正则 表达 式 会 被 编译 成 RegexObject 实例 , 可 以 为 不 同 的 操作 提供 方法 , 如 模式 匹配 搜索 或 字符 串 替 换 。 
如 表 13-6 所 示 为 RegexObject 实例 的 一 些 方法 和 属性 。 


图 13-12 运行 结果 


表 13-6 ”RegexObject 实例 的 方法 和 属性 


方法 /属性 描述 


matchO) 决定 re 是 否 在 字符 串 刚 开始 的 位 置 匹配 

扫描 字符 串 ， 找 到 这 个 re 匹配 的 位 置 
findallO 找到 re 匹配 的 所 有 子 串 ， 并 把 它们 作为 一 个 列表 返回 
finditer0) 找到 re 匹配 的 所 有 子 串 ， 并 把 它们 作为 一 个 迭代 器 返回 


如 果 没有 匹配 到 ，matchO0 和 search0 将 返回 None。 如 果 成 功 ， 就 会 返回 一 个 MatchObject 实例 ， 其 中 有 
这 次 匹配 的 信息 : 它 是 从 哪里 开始 和 结束 ， 它 所 匹配 的 子 串 等 。 
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【 例 13-13】MatchObject 实例 的 应 用 。 

>>> import re 

>>> p=re.compile('[0-9]+9) 

>>> m=p.match('123456') 

>>> print (m) 

<re.Match object; span=(0, 6), match='123456'> 

>>> m.group() 

"123456" 

>>> m.group (0) 

"123456" 

>>> m.group (1) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

IndexError: no such group 


13.4 ”分 组 匹配 与 匹配 对 象 使 用 


所 有 的 语言 基本 上 都 有 一 种 强大 的 用 法 : 正则 表达 式 。 但 是 ，Python 里 面 有 一 种 匹配 ， 称 为 匹配 对 象 
和 组 。 分 组 ， 即 分 组 匹配 ， 也 称 为 捕获 组 ， 是 正则 中 的 一 种 比较 重要 的 匹配 方式 。 此 外 ， 后 向 引用 和 分 组 
相 结合 ， 可 以 写 出 很 多 复杂 匹配 场景 的 正则 。 


13.4.1 分 组 基础 


分 组 就 是 用 一 对 圆 括号 “0” 括 起 来 的 正则 表达 式 ， 匹 配 出 的 内 容 就 表示 一 个 分 组 。 从 正则 表达 式 的 左 
边 开 始 看 ， 看 到 的 第 一 个 左 括号 “(” 表 示 第 一 个 分 组 ， 第 二 个 表示 第 二 个 分 组 ， 以 此 类 推 ， 需 要 注意 的 是 ， 
有 一 个 隐 含 的 全 局 分 组 〈 就 是 0)， 就 是 整个 正则 表达 式 。 

完 组 以 后 ， 要 想 获得 某 个 分 组 的 内 容 ， 直 接 使 用 group(num) 和 groupsO 函 数 去 直接 提取 就 行 。 

分 组 的 方法 : 将 子 表达 式 用 小 括号 括 起 来 ， 如 (exp)， 表 示 匹 配 表 达 式 exp， 并 捕获 文本 到 自动 命名 的 
组 里 。 

【 例 13-14】 分 组 举例 1。 

import re 

5='ala b2b a3a' 

p=re.compile(r'a(\d)a') 

print (re.findall (p, s)) 


程序 运行 结果 如 图 13-13 所 示 。 13-13 ”运行 结果 
【 例 13-15】 分 组 举例 2。 
import re 


5 = "alb2 c3d4 ea7f' 
pl = re.compile(r' [a-z] \d[a-z]\d') 
print (re.findall (pl, s)) 


p2 = re.compile(r' [a-z]\d[a-z] (\d) ') 
print (re.findall (p2, s)) 


Pp3 = re.compile(r' [a-z] (\d) [a-z] (\d)') 
print (re.findall (p3, s)) 


程序 运行 结果 如 图 13-14 所 示 。 图 13-14 ”运行 结果 
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【 例 13-16】 分 组 举例 3。 
import re 
5 = 'name:Python,age:10;name:world,age:20" 
p= re.compile(r'name: (\w+),age: (\d+)"') 
it = re.finditer (p, s) 
or mn jn Lt 

print('—————— ") 

print (m.group()) 

print (m.group (0)) 

print (m.group (1) ) 

print (m.group (2)) 


程序 运行 结果 如 图 13-15 所 示 。 图 13-15 运行 结果 


13.4.2 ”匹配 对 象 与 组 的 使 用 


在 Python 中 ， 当 能 够 找到 匹配 项 的 时 候 ， 都 会 返回 MathObject 对 象 ， 这 些 对 象 包 括 匹 配 模 式 的 子 字 符 
串 信 息 。 它 们 还 包含 哪个 模式 匹配 了 字符 串 的 哪 部 分 信息 一 一 这 些 部 分 就 是 组 。 
【 例 13-17】 匹 配对 象 与 组 的 使 用 1 。 


import re 

5='Python@163.com' 

"(\w{4,20})@ (1631qqlgmailloutlook) \. (com)" 
n=re.match (p, 5) 


print (n.group()) 
print (n.group(1)) 
程序 运行 结果 如 图 13-16 所 示 。 ps 
图 13-16 运行 结果 
【 例 13-18】 匹配 对 象 与 组 的 使 用 2。 


>>> import re 

>>> m=re.match(r"(\w+) (\w+)","We are family") 
>>> m.group (0) 

"We are' 

>>> 了 .group (1) 

We! 

>>> 了 .group (1,2) 

("We', "are') 


13.4.3 ”匹配 对 象 与 索引 使 用 
如 表 13-7 所 示 为 匹配 对 象 的 方法 和 属性 。 


表 13-7 ”匹配 对 象 的 方法 和 属性 


方法 /描述 描 述 
groupO 返回 被 re 匹配 的 字符 串 
startO | 返回 匹配 开始 的 位 置 
end0 返回 匹配 结束 的 位 置 
span() 返回 一 个 元 组 包含 匹配 〈 开 始 ， 结 束 ) 的 位 置 


【 例 13-19】 匹 配对 象 与 索引 应 用 举例 。 

import re 
m=re.match(r'www\. (.*)\..{3}', 'www.python.org') 
print (m.group ()) 

print (m.group (0)) 
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print (m.group (1)) 
print (m. start (1)) 
print (m.end (1)) 
print (m. span (1)) 


程序 运行 结果 如 图 13-17 所 示 。 

group 方法 返回 模式 中 与 给 定 组 匹配 的 字符 串 ， 如 果 没 有 组 号 ， 默 认 
为 0， 如 上 面 m.groupO 一 m.group(0); 如 果 给 定 一 个 组 号 ， 会 返回 单个 字 
符 串 。start0 方 法 返回 给 定 组 匹配 项 的 开始 索引 ，end(0 方 法 返回 给 定 组 匹 
配 项 的 结束 索引 加 1，span0 方 法 以 元 组 〈start，end) 的 形式 返回 给 组 的 
开始 和 结束 位 置 的 索引 。 


13.4.4 ”分 组 扩展 


(2...) 是 一 个 扩展 注 记 符 ， 其 是 一 个 完整 的 组 合 ， 此 时 才 有 真正 的 含义 。 换 句 话说 ， 如 果 只 是 一 个 左 半 
圆 括号 后 面 跟着 一 个 问号 ? ， 但 是 后 面 却 没有 右 半圆 括号 ， 则 前 面 的 左 半圆 括号 和 问号 是 没有 特殊 含义 的 ， 
只 是 普通 的 正则 表达 式 中 的 字符 而 已 。 而 关于 本 身 〈?.…) 这 个 扩展 助 记 符 ， 完 整 的 组 合 的 含义 要 取决 于 问 
号 后 面 的 那个 字符 。 如 表 13-8 所 示 ， 就 是 一 些 常用 的 扩展 字符 。 


加 


13-17 ”运行 结果 


表 13-8 扩展 字符 及 描述 


扩展 字符 描述 


QiLmsux) 设置 匹配 标志 ， 可 以 是 i、L、m、s、u、x 以 及 它们 的 组 合 
和 全 洒 表示 一 个 匹配 不 用 保存 的 分 组 

(2?P<name>.…) 像 普通 的 匹配 组 ， 只 表示 名 称 ， 不 表示 数字 了 D 
(2P=name) 在 同一 字符 串 中 匹配 由 〈?P<name) 分 组 的 之 前 文本 

(9## 指定 注释 ， 忽 略 所 有 内 容 


正 向 前 行 匹配 。“=” 后 的 内 容 出 现 则 匹配 ， 但 不 返回 “=” 后 的 内 容 
负 向 前 行 匹配 。“!” 后 的 内 容 不 出 现 则 匹配 ， 但 不 返回 “!” 后 内 容 
正 向 后 行 匹配 。 与 〈?=.…) 含义 相同 
(<1..) 负 向 后 行 匹配 。 与 ?1...) 含义 相同 


接 下 来 一 起 举例 研究 一 下 正则 表达 式 常用 扩展 字符 的 功能 。 
通过 使 用 〈?iLmsux) 系列 选项 ， 可 以 直接 在 正则 表达 式 里 面 指定 一 个 或 者 多 个 标记 。 
【 例 13-20】 (〈?iLmsux) 应 用 举例 。 


>>> import re 
>>> re.findall (r' (?i)yes','yes! Yes.. YES??') 
['yes', 'Yes'’, ‘YES'] 
>>> re.findall(r' (?i)p\w+','Python is a very easy to use programming language') 
['Python', 'programming'] 
>>> re.findall(r' (?im) (^th[\w J]+)',""" 
sasThis 4s the firsty 
. another line, 
。that line,it's the best 


mm) 


['This is the first', "that line'] 
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(3:.….)， 常 规 括 号 的 非 捕 获 版 本 。 匹 配 括号 内 的 正则 表达 式 ， 但 在 执行 匹配 后 或 在 模式 中 
不 能 检索 组 


匹配 的 子 字符 串 。 
) 应 用 举例 。 


import re 
def groups (p): 
if p is not None: 
Print ("p.group()==%s"%p.group()), 
else: 
print ("p.group()==None"), 


第 国 章 正则 表达 式 


print ("p.groups ()==%s"%str (p.groups ())) 


p=re.match("(?:[abcd]) (color)","acolor") 
groups (p) 


程序 运行 结果 如 图 13-18 所 示 。 


(?P<name>.…) 表示 为 组 设置 一 个 名 字 。 与 常规 括号 类 似 ,但 组 
子 字符 


读 


人 


可 通过 符号 组 名 称 访问 。 组 名 必须 是 有 效 的 Python 标识 符 ， 并 


h 稍 后 引用 时 ， 


匹配 的 
且 


图 13-18 ”运行 结果 


组 名 只 能 在 正则 表达 式 中 定义 一 次 。 符 号 组 也 是 编号 组 ， 就 像 组 未 命名 一 样 。 


【 例 13-22】 〈?P<name>.…) 应 用 举例 。 
>>> import re 
>>> p=re.compile(r' (?P<N>a) \w(c) ') 


>>> p.search('abcdef') .groups() 
(a'r, ‘ec') 

>>> p.search('abcdef') .group (1) 
ar 

>>> p.search('abcdef') .group (2) 
‘er 

>>> p.search('abcdef') .group() 
'abc' 

>>> p.search('abcdef') .groupdict () 
{'N': ra'} 


(?P=name) 引用 命名 分 组 〈 别 名 ) 匹配 。 
【 例 13-23】 〈?P=name) 应 用 举例 。 

>>> import re 

>>> p=re.compile(r' (?P<N>a) \w(c) (?P=N)') 
>>> p.search('abcdef') .group() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
Attributegrror: 
>>> p.search('abcadef') .group () 
"abca' 
>>> p. 
人 
>>> p. 
ar 
>>> p. 
‘er 


(3=...) 正 向 前 行 匹 配 。“=” 后 的 内 容 出 现 则 
行 匹 配 ， 总 是 对 后 面 进行 匹配 。 
【 例 13-24】〈?=-.…) 应 用 举例 。 


>>> import re 


search ('abcadef') .groups () 
‘er) 
search('abcadef') .group (1) 


search ('abcadef') .group (2) 


# 分 两 组 : 命名 分 组 + 匿名 分 组 
# 取 所 有 分 组 ,元 组 形式 返回 


# 取 分 组 1 

# 取 分 组 2 

#4 默认 返回 匹配 的 字符 囊 

#4 命名 分 组 可 以 返回 一 个 字典 


#4(?P=K) 引用 分 组 1 的 值 ,就 是 a 
# 匹 配 不 到 ,因为 完整 'a\wca' ,模式 的 第 4 位 是 a 


'NoneType' object has no attribute 'group' 


#4 匹配 到 ,模式 的 第 4 位 和 组 1 一 样 , 值 是 c 


« 


回 
可 


匹配 ， 但 不 返 匹配 .… 表 达 式 ， 返 


”后 的 内 容 。 
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peor drm ( 超 值 版 ) 
NS 


(?<=.…) 正 向 后 行 匹配 ， 与 〈?=.…) 含义 相同 。 匹 配 .表达 式 ， 返 回 。 对 前 进行 匹配 ， 总 是 对 前 面 进行 
匹配 。 
【 例 13-25】 〈?<=.…) 应 用 举例 。 


(31...) 负 向 前 行 匹配 。“!” 后 内 容 不 出 现 则 匹配 ， 但 不 返回 “!” 后 内 容 。 
【 例 13-26】 〈?!..) 应 用 举例 。 


(?<1...) 负 向 后 行 匹 配 ， 与 〈?!...) 含义 相同 。 不 匹配 ... 表 达 式 ， 返 回 。 对 前 进行 匹配 ， 总 是 对 前 面 进 
行 匹配 。 
【 例 13-27】 〈?<!..) 应 用 举例 。 
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13.5 ”正则 表达 式 应 用 实例 


经 过 前 面 几 节 的 学 习 ， 相 信 读 者 已 经 对 正则 表达 式 有 所 掌握 了 ， 本 节 简 单 地 介绍 几 个 应 用 实例 ， 有 助 
于 读者 加 深 对 正则 表达 式 的 理解 。 

【 例 13-28】〗 判 断 字 符 串 是 否 是 全 部 小 写 。 
import re 
sl1='abcdefg' 
52="'abc123DEF' 
p=re.search('^[a-z]+$',51) 
EF ps 

print ('sl:',p.group (),' 全 为 小 写 ') 
else: 

print (sl, ' 不 全 是 小 写 ') 
pl=re.search('^[a-z]+$',5s2) 
> 

print ('s2:',pl.group(),' 全 为 小 写 ') 
else: 


print (s2, ' 不 全 是 小 写 ') 
程序 运行 结果 如 图 13-19 所 示 。 
狗 之 辣 旺 
【 例 13-29】 去 掉 数 字 中 的 逗号 。 pp 
import re 
s="abc, 123, 456, 789, def" 
while 1: 
m=re.search("\d, \d",s) 
if m: 
m=m.group () 
5=5.replace (m,m.replace(",","")) 
print (s) 
else: 
break 
程序 运行 结果 如 图 13-20 所 示 。 13-20 ”运行 结果 
【 例 13-30】 删 除 指定 字符 。 
import re 
def deleteword(s, dele = "''): 
ee ny 
parttern = re.compile(r'^\s|\s$') 
else: 
parttern = re.compile (dele) 


return parttern.sub('',s) 
print (deleteword(' 世 界 这 么 大 ,我 想 去 看 看 ',' 我 ') ) 
print (deleteword(' 生 活 不 止 眼前 的 苟且 ,还 有 诗 和 远方 ', ' 远 方 ') ) 


程序 运行 结果 如 图 13-21 所 示 。 13-21 ”运行 结果 


13.6 ”就 业 面试 技巧 与 解析 


学 习 了 本 章 之 后 ， 要 对 正则 表达 式 有 一 个 全 面 的 了 解 ， 例 如 ，Python 正则 式 的 基本 用 法 ，re 模块 的 基 
本 函数 ， 以 及 Python 中 的 re 模块 函数 ， 因 此 在 面试 中 应 全 面 理 解 这 一 知识 。 


tt 
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/并 
hon 从 入 门 到 项 目 实践 ( 超 值 版 ) 
NO 


13.6.1 ”面试 技巧 与 解析 (一) 


面试 官 : 什么 是 正则 表达 式 ? 谈 谈 你 对 正则 表达 式 的 理解 。 

应 聘 者 : 正则 表达 式 (Regular Expression，RE) 又 称 为 正规 表示 法 或 常规 表示 法 ， 常 常用 来 检索 、 替 
换 那些 符合 某 个 模式 的 文本 。 它 首先 设 定好 了 一 些 特殊 的 字 及 字符 组 合 ， 通 过 组 合 的 “规则 字符 串 ” 来 对 
表达 式 进行 过 滤 ， 从 而 获取 或 匹配 想 要 的 特定 内 容 。 它 具有 灵活 、 逻 辑 性 和 功能 性 强 ， 能 迅速 地 通过 表达 
式 从 字符 捉 中 找到 所 需 信息 的 优点 ， 但 对 于 刚 接触 的 人 来 说 ， 比 较 星 涩 难 懂 。 


13.6.2 ”面试 技巧 与 解析 (二 ) 


面试 官 :如 何 用 Python 来 进行 查询 和 替换 一 个 文本 字符 串 ? Python 中 re 模块 函数 里 面 search0 和 matchO 
函数 有 何 区 别 ? 

应 聘 者 : 可 以 使 用 sub() 方 法 来 进行 查询 和 替换 ，sub 方法 的 格式 为 : 

subl(replacement, string[, count=0]) 

replacement 是 被 蔡 换 成 的 文本 ; 

string 是 需要 被 替换 的 文本 ; 

count 是 一 个 可 选 参数 ， 指 最 大 被 替换 的 数量 。 

match(0) 函 数 只 检测 RE 是 不 是 在 string 的 开始 位 置 匹配 ,search(O) 会 扫描 整个 string 查找 匹配 , 也 就 是 说 
matchO 只 有 在 0 位 置 匹配 成 功 的 话 才 有 返回 ， 如 果 不 是 开始 位 置 匹 配 成 功 的 话 ，match0 就 返回 None。 
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第 14 章 
Python 线程 和 进程 


让 >” 学习 指引 


现在 的 程序 开发 已 经 很 少 有 单线 程 的 程序 了 ， 随 着 大 数据 大 流量 的 到 来 ， 任 何 一 个 程序 都 将 涉及 多 
线程 。 


”重点 导读 


。 了 解 进 程 的 概念 。 
。 了解 线 程 的 概念 。 
。 掌 握 进程 的 模块 。 
* 掌握 线 程 的 类 和 模块 。 


14.1 进程 


进程 相当 于 一 个 容器 ， 所 有 的 线程 都 运行 在 进程 中 。 进 程 (Process) 是 计算 机 中 的 程序 关于 某 数据 集 
合 上 的 一 次 运行 活动 ， 是 系统 进行 资源 分 配 和 调度 的 基本 单位 ， 是 操作 系统 结构 的 基础 。 在 早期 面向 进程 
设计 的 计算 机 结构 中 ， 进 程 是 程序 的 基本 执行 实体 ， 在 当代 面向 线程 设计 的 计算 机 结构 中 ， 进 程 是 线程 的 
容器 。 程 序 是 指令 、 数 据 及 其 组 织 形式 的 描述 ， 进 程 是 程序 的 实体 。 


14.1.1 进程 基础 


狭义 定义 ， 进 程 是 正在 运行 的 程序 的 实例 。 

广义 定义 : 进程 是 一 个 具有 一 定 独立 功能 的 程序 ， 关 于 某 个 数据 集合 的 一 次 运行 活动 。 它 是 操作 系统 
动态 执行 的 基本 单元 ， 在 传统 的 操作 系统 中 ， 进 程 既是 基本 的 分 配 单元 ， 也 是 基本 的 执行 单元 。 

1. 进程 的 概念 

第 一 ， 进 程 是 一 个 实体 。 每 一 个 进程 都 有 它 自己 的 地 址 空间 ， 一 般 情况 下 ， 包 括 文本 区 域 、 数 据 区 域 
和 堆栈 区 域 。 文 本 区 域 存储 处 理 器 执行 的 代码 ; 数据 区 域 存储 变量 和 进程 执行 期 间 使 用 的 动态 分 配 的 内 存 ; 


AN 
on 从 入 门 到 项 目 实践 ( 超 信 版 ) 
NO 


堆栈 区 域 存储 着 活动 过 程 调用 的 指令 和 本 地 变量 。 

第 二 ， 进 程 是 一 个 “执行 中 的 程序 ”。 程 序 是 一 个 没有 生命 的 实体 ， 只 有 处 理 器 赋予 程序 生命 时 ( 操 
作 系 统 执行 之 )， 它 才能 成 为 一 个 活动 的 实体 ， 我 们 称 其 为 进程 。 

进程 是 操作 系统 中 最 基本 、 重 要 的 概念 ， 是 多 道 程序 系统 出 现 后 , 为 了 刻画 系统 内 部 出 现 的 动态 情况 ， 
描述 系统 内 部 各 道 程序 的 活动 规律 引进 的 一 个 概念 ， 所 有 多 道 程序 设计 操作 系统 都 建立 在 进程 的 基础 上 。 

2. 为 什么 要 引入 进程 

从 理论 角度 看 ， 进 程 是 对 正在 运行 的 程序 过 程 的 抽象 。 

从 实现 角度 看 ， 进 程 是 一 种 数据 结构 ， 目 的 在 于 清晰 地 刻画 动态 系统 的 内 在 规律 ， 有 效 管 理 和 调度 进 
入 计算 机 系统 主 存储 器 运行 的 程序 。 

3. 进程 的 一 些 特征 表现 

动态 性 ， 进程 的 实质 是 程序 在 多 道 程序 系统 中 的 一 次 执行 过 程 ， 进 程 是 动态 产生 、 动 态 消亡 的 。 

并 发 性 : 任何 进程 都 可 以 同 其 他 进程 一 起 并 发 执行 。 

独立 性 ， 进 程 是 一 个 能 独立 运行 的 基本 单位 ， 同 时 也 是 系统 分 配 资源 和 调度 的 独立 单位 。 

异步 性 ， 由 于 进程 间 的 相互 制约 ， 使 进程 具有 执行 的 间断 性 ， 即 进程 按 各 自 独立 的 、 不 可 预知 的 速度 
向 前 推进 。 

结构 特征 ， 进 程 由 程序 、 数 据 和 进程 控制 块 三 部 分 组 成 。 

多 个 不 同 的 进程 可 以 包含 相同 的 程序 : 一 个 程序 在 不 同 的 数据 集 里 就 构成 不 同 的 进程 ， 能 得 到 不 同 的 
结果 ， 但 是 执行 过 程 中 ， 程 序 不 能 发 生 改 变 。 

4. 进程 与 程序 的 区 别 

程序 是 指令 和 数据 的 有 序 集合 ， 其 本 身 没有 任何 运行 的 含义 ， 是 一 个 静态 的 概念 。 

而 进程 是 程序 在 处 理 机 上 的 一 次 执行 过 程 ， 它 是 一 个 动态 的 概念 。 

程序 可 以 作为 一 种 软件 资料 长 期 存在 ， 而 进程 是 有 一 定 生命 期 的 。 

程序 是 永久 的 ， 进 程 是 暂时 的 。 

5. 进程 的 生命 周期 

进程 有 三 种 状态 不 断 切换 ， 三 种 状态 的 转换 如 图 14-1 所 示 。 


进程 调度 


时 间 片 到 


14-1 进程 状态 转换 


在 程序 运行 的 过 程 中 ， 由 于 被 操作 系统 的 调度 算法 控制 ， 程 序 会 进入 几 个 状态 :就绪 、 运 行 和 阻塞 。 

(1) 就 绪 (Ready) 状态 。 当 进程 已 分 配 到 除 CPU 以 外 的 所 有 必要 的 资源 ， 只 要 获得 处 理 机 便 可 立即 
执行 时 ， 这 时 的 进程 状态 称 为 就 绪 状态 。 

(2) 执行 /运行 (Running) 状态 。 当 进程 已 获得 处 理 机 ， 其 程序 正在 处 理 机 上 执行 时 ， 此 时 的 进程 状态 
称 为 执行 状态 。 

(3) 阻塞 (Blocked) 状态 。 正 在 执行 的 进程 ， 由 于 等 待 某 个 事件 发 生 而 无 法 执行 时 ， 便 放弃 处 理 机 
而 处 于 阻塞 状态 。 引 起 进程 阻塞 的 事件 可 有 多 种 ， 例 如 ， 等 待 IO 完成、 申请 缓冲 区 不 能 满足 、 等 待 信 
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件 〈 信 号 ) 等 。 

6. 同步 和 异步 

同步 是 一 个 任务 的 完成 需要 依赖 另外 一 个 任务 ， 只 有 等 待 被 依赖 的 任务 完成 后 ， 依 赖 的 任务 才能 算 完 
成 ， 这 是 一 种 可 靠 的 任务 序列 。 要 成 功 都 成 功 ， 要 失败 都 失败 ， 两 个 任务 的 状态 可 以 保持 一 致 。 

异步 是 不 需要 等 待 被 依赖 的 任务 完成 ， 只 是 通知 被 依赖 的 任务 要 完成 什么 工作 ， 依 赖 的 任务 也 立即 执 
行 ， 只 要 自己 完成 了 整个 任务 就 算 完成 了 。 至 于 被 依赖 的 任务 最 终 是 否 真正 完成 ， 依 赖 它 的 任务 无 法 确定 ， 
所 以 它 是 不 可 靠 的 任务 序列 。 

例如 ， 现 实 中 去 医院 就 诊 ， 可 能 会 有 以 下 两 种 方式 。 

第 一 种 : 选择 排队 等 候 。 

第 二 种 : 到 就 诊 台 挂号 ， 等 待 叫 号 机 叫 号 就 诊 。 

前 者 (排队 等 候 ) 就 是 同步 等 待 消息 通知 ， 需 要 一 直 等 待 直至 前 面 的 人 就 诊 完毕 。 

后 者 (等 待 叫 号 机 通知 ) 就 是 异步 等 待 消息 通知 。 在 异步 消息 处 理 中 ， 等 待 消息 通知 者 往往 注册 一 个 
可 调 机 制 ， 在 所 等 待 的 事件 被 触发 时 由 触发 机 制 〈 在 这 里 是 叫 号 机 ) 通过 某 种 机 制 〈 挂 号 的 号 码 ) 找到 等 
待 该 事件 的 人 。 

7. 阻塞 与 非 阻塞 

阻塞 和 非 阻塞 这 两 个 概念 与 程序 (线程 ) 等 待 消息 通知 〈 无 所 谓 同 步 或 者 异步 ) 时 的 状态 有 关 。 也 就 
是 说 ， 阻 塞 与 非 阻塞 主要 是 从 程序 (线程 ) 等 待 消息 通知 时 的 状态 角度 来 说 的 。 

继续 上 面 的 那个 例子 ， 不 论 是 排队 还 是 使 用 号 码 等 待 通知 ， 如 果 在 这 个 等 待 的 过 程 中 ， 等 待 者 除了 等 
待 消息 通知 之 外 不 能 做 其 他 的 事情 ， 那 么 该 机 制 就 是 阻塞 的 ， 表 现在 程序 中 ， 也 就 是 该 程序 一 直 阻塞 在 该 
函数 调用 处 不 能 继续 往 下 执行 。 

相反 ,有 的 人 喜欢 在 医院 就 诊 的 时 候 边 玩 游戏 、 看 电影 边 等 待 ， 这样 的 状态 就 是 非 阻塞 的 ， 因为 他 (等 
待 者 ) 没有 阻塞 在 这 个 消息 通知 上 ， 而 是 一 边 做 自己 的 事情 一 边 等 待 。 

注意 : 同步 非 阻塞 形式 实际 上 是 效率 低下 的 ， 想 象 一 下 你 一 边 玩 着 游戏 一 边 还 需要 抬头 看 到 底 队 伍 排 
到 你 了 没有 。 如 果 把 玩 游戏 和 观察 排队 的 位 置 看 成 是 程序 的 两 个 操作 的 话 ， 这 个 程序 需要 在 这 两 种 不 同 的 
行为 之 间 来 回 切换 ， 效 率 可 想 而 知 是 低下 的 ; 而 异步 非 阻塞 形式 却 没有 这 样 的 问题 ， 因 为 玩 游戏 是 你 (等 待 
者 ) 的 事情 ， 而 通知 你 则 是 叫 号 机 (消息 触发 机 制 ) 的 事情 ， 程 序 无 须 在 两 种 不 同 的 操作 中 来 回 切换 。 

8. 同步 /异步 与 阻塞 / 非 阻塞 

(1) 同步 阻塞 形式 ， 效 率 最 低 。 拿 上 面 的 例子 来 说 ， 就 是 你 专心 排队 ， 什 么 别 的 事 都 不 做 。 

(2) 异步 阻塞 形式 。 如 果 在 医院 就 诊 的 人 采用 的 是 异步 的 方式 去 等 待 消息 被 触发 (通知 )， 也 就 是 领 
了 一 张 小 纸 条 ， 假 如 在 这 段 时 间 里 他 不 能 离开 医院 做 其 他 的 事情 ， 那 么 很 显然 ， 这 个 人 被 阻塞 在 了 这 个 
等 待 的 操作 上 面 。 异 步 操作 是 可 以 被 阻塞 住 的 ， 只 不 过 它 不 是 在 处 理 消息 时 阻塞 ， 而 是 在 等 待 消息 通知 
时 被 阻塞 。 

(3) 同步 非 阻塞 形式 ， 实 际 上 是 效率 低下 的 。 想 象 一 下 你 一 边 玩 游戏 一 边 还 需要 抬头 看 到 底 队伍 排 到 
你 了 没有 ， 如 果 把 玩 游戏 和 观察 排队 的 位 置 看 成 是 程序 的 两 个 操作 的 话 ， 这 个 程序 需要 在 这 两 种 不 同 的 行 
为 之 间 来 回 切 换 ， 效 率 可 想 而 知 是 低下 的 。 

(4) 异步 非 阻 塞 形式 ， 效 率 更 高 。 因 为 玩 游戏 是 你 等待 者 ) 的 事情 ， 而 通知 你 则 是 叫 号 机 (消息 触 
发 机 制 ) 的 事情 ， 程 序 没有 在 两 种 不 同 的 操作 中 来 回 切换 。 

例如 ， 这 个 人 突然 发 觉 自 己 烟 瘾 犯 了 ， 需 要 出 去 抽 根 烟 ， 于 是 他 告诉 前 全 护士 ， 排 到 我 这 个 号 码 的 
时 候 麻烦 到 外 面 通知 我 一 下 , 那么 他 就 没有 被 阻塞 在 这 个 等 待 的 操作 上 面 ,自然 这 个 就 是 异步 + 非 阻塞 的 方 
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式 了 。 
很 多 人 会 把 同步 和 阻塞 混淆 ， 是 因为 很 多 时 候 同步 操作 会 以 阻塞 的 形式 表现 出 来 。 同 样 地 ， 很 多 人 也 
会 把 异步 和 非 阻塞 混淆 ， 因 为 异步 操作 一 般 都 不 会 在 真正 的 IO 操作 处 被 阻塞 。 


14.1.2 ”multiprocess 模块 


了 Python 中 的 多 线程 无 法 利用 多 核 优势 ， 如 果 想 要 充分 地 使 用 多 核 CPU 的 资源 〈os.cpu_countO 查 看 )， 
在 Python 中 大 部 分 情况 下 需要 使 用 多 进程 ， 因 此 ，Python 提供 了 multiprocessing。 

mnultiprocessing 模块 用 来 开启 子 进程 ， 并 在 子 进程 中 执行 用 户 定制 的 任务 〈 例 如 函数 )， 该 模块 与 多 线 
程 模块 threading 的 编程 接口 类 似 。 

multiprocessing 模块 的 功能 众多 : 支持 子 进程 、 通 信和 共享 数据 , 执行 不 同形 式 的 同步 , 提供 了 Process、 
Queue、Pipe、Lock 等 组 件 。 

需要 再 次 强调 的 一 点 是 : 与 线程 不 同 ， 进 程 没有 任何 共享 状态 ， 进 程 修改 的 数据 ， 改 动 仅 限于 该 进程 内 。 

1. Process 类 的 介绍 

创建 进程 的 类 : 

Process([group [,target [,name [,args [,kwargs]]]]]) 

由 该 类 实例 化 得 到 的 对 象 ， 表 示 一 个 子 进程 中 的 任务 (尚未 启动 )。 

注意 : 

(1) 需要 使 用 关键 字 的 方式 来 指定 参数 。 

(2 ) args 指定 的 为 传 给 target 函数 的 位 置 参数 ， 是 一 个 元 组 形式 ， 必 须 有 过 号 。 

Process 类 的 参数 如 下 。 

group: 参数 未 使 用 ， 值 始终 为 None。 

target: 表示 调用 对 象 ， 即 子 进程 要 执行 的 任务 。 

args: 表示 调用 对 象 的 位 置 参 数 元 组 ，args=(1,2,'egon',)。 

kwargs: 表示 调用 对 象 的 字典 ，kwargs={'name': 'egon','age': 18}。 

name: 为 子 进程 的 名 称 。 

2. Process 类 的 常用 方法 

p.start(): 启动 进程 ， 并 调用 该 子 进程 中 的 prun0。 

p.run0: 进程 启动 时 运行 的 方法 , 正 是 它 去 调用 target 指定 的 函数 , 自 定 类 的 子 类 中 一 定 要 实现 该 方法 。 

p.terminate0: 强制 终止 进程 p， 不 会 进行 任何 清理 操作 ， 如 果 p 创建 了 子 进程 ， 该 子 进程 就 成 了 僵尸 
进程 ， 使 用 该 方法 需要 特别 小 心 这 种 情况 。 如 果 p 还 保存 了 一 个 锁 那 么 也 将 不 会 被 释放 ， 进 而 导致 死 锁 。 

p.is_alive0: 如 果 仍然 运行 ， 返回 True。 

p:join([timeoutl): 主线 程 等 待 p 终止 (强调 : 是 主线 程 处 于 等 的 状态 , 而 p 是 处 于 运行 的 状态 )。timeout 
是 可 选 的 超时 时 间 ， 需 要 强调 的 是 ，pjoin 只 能 限制 住 start 开启 的 进程 ， 而 不 能 限制 住 run 开启 的 进程 。 

3. Process 类 的 属性 

p.daemon: 默认 值 为 False， 如 果 设 为 True， 代 表 p 为 后 台 运 行 的 守护 进程 ， 当 p 的 父 进程 终止 时 ，Pp 
也 随 之 终止 ， 并 且 设 定 为 True 后 ，p 不 能 创建 自己 的 新 进程 ， 必 须 在 p.start0 之 前 设置 。 

p.name: 进程 的 名 称 。 

p.pid: 进程 的 pid。 
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Pp-exitcode: 进程 在 运行 时 为 None， 如 果 为 -N， 表 示 被 信号 N 结束 (了 解 即 可 )。 

p.authkey: 进程 的 身份 验证 键 ， 默 认 是 由 os.urandom0 随 机 生成 的 32 字符 的 字符 串 。 这 个 键 的 用 途 是 
为 涉及 网 络 连 接 的 底层 进程 间 通 信 提 供 安全 性 ， 这 类 连接 只 有 在 具有 相同 的 身份 验证 键 时 才能 成 功 。 

4. 使 用 process 模块 创建 进程 

下 面 给 出 一 个 关于 Python 进程 中 开启 子 进程 ，start 方法 和 并 发 效果 ， 具 体 代码 如 下 。 

import time 

from multiprocessing import Process 

def f(name): 


print('hello', name) 


print ('hai 我 是 子 进程 ') 


if _name =="'_ main_'; 
p= Process(target=f, args=('start',)) 
p.start () 
time.sleep (1) 
print (' 主 进程 被 执行 ') 


注意 : 在 Windows 操作 系统 中 由 于 没有 fork(Linux 操作 系统 中 创建 进程 的 机 制 )， 在 创建 子 进程 的 时 候 
会 自动 import 启动 它 的 这 个 文件 ， 而 在 import 的 时 候 又 执行 了 整个 文件 。 因 此 ， 如 果 将 process0 〇 直接 写 
在 文件 中 就 会 无 限 递归 创建 子 进 程 报错 。 所 以 必须 把 创建 子 进程 的 部 分 使 用 让 _name “一 ' main '， 判 
断 保护 起 来 ，import 的 时 候 就 不 会 递归 运行 了 。 

下 面 给 出 一 段 关 于 使 用 join 方法 创建 进程 的 实例 ， 具 体 代 码 如 下 。 

import time 

from multiprocessing import Process 

def f(name): 

print('hello', name) 


time.sleep (1) 
print (' 我 是 子 进程 ') 
if name == ' main ': 
Pp = Process(target=f, args=('join',)) 
p.start () 


Pp.join() # 等 待 p 停 止 , 才 执行 下 一 行 代码 
print (" 我 是 父 进程 ') 
下 面 给 出 一 段 查看 主 进程 和 子 进程 的 进程 号 的 实例 ， 具 体 代码 如 下 。 
import os 
from multiprocessing import Process 
def f(x): 
print (" 子 进程 id : ',os.getpid(),' 父 进程 id : ',os.getppid()) 
return x*x 


if _name ==' main ，: 
print (' 主 进程 id : '，os.getpid()) 
plst = [] 


for i in range(5): 
Pp = Process (target=f, args=(i,)) 
p.start () 


进 阶 ， 多 个 进程 同时 运行 (注意 ， 子 进程 的 执行 顺序 不 是 根据 启动 顺序 决定 的 )。 
5. 继承 Process 类 开启 进程 
用 户 可 以 根据 自己 的 需求 自 定义 类 继承 Process， 通 过 继承 的 方式 开启 进程 ， 下 面 给 出 一 段 实例 代码 ， 
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具体 如 下 。 


from multiprocessing import Process 
import os，time 
# 定 义 一 个 类 ,继承 Process 类 
class Download(Process) : 
def ”init (self,interval) :# 这 里 重 载 父 类 ”init 方法 的 原因 是 对 和 象 要 传 个 参数 , 与 下 面 run 方法 的 执行 没有 关系 
Process. init (self) 
self.interval=interval  # 和 参数 所 对 应 的 属性 
# 重 写 Process 类 中 的 run () 方法 
def run(self) : 
# 开 启 这 个 进程 所 要 执行 的 代码 
t start=time.time() 
#time.sleep (3) # 阻 塞 的 另 一 种 实现 形式 
print (' 开 启 进 程 : %s 进行 下 载 操作 ' % os.getpid () ) 
print (' 子 进程 (%s) 开始 执行 , 父 进程 为 (%s)' % (os.getpid()，os.getppid())) 
time.sleep (self.interval) 
t_stop=time.time () 
print (' 子 进程 (%s) 执行 结束 , 耗 时 $f 秒 '%(o0s.getpid(),t_stop-t_start)) 
if name =='_ main_': 
t start=time.time() 
print (' 当 前 进程 (%s)' % os.getpid()) 
p = Download(2) 
# 对 于 一 个 不 包含 target 属性 的 Process 类 ， 
# 执 行 start () 方 法 ,表示 子 进程 就 会 运行 类 中 的 run () 
p.start () 
#p.join(10) 
time.sleep (10)# 区 分 sleep 与 join() 区 别 
t_stop=time.time () 
print (' 主 进程 %s 执行 结束 , 耗 时 $f 秒 '% (os.getpid(),t_stop-t_start)) 


14.1.3 ”进程 同步 


当 多 个 进程 使 用 同一 份 数 据 资源 的 时 候 ， 就 会 引发 数据 安全 或 顺序 混乱 问题 ， 因 此 进程 中 提供 了 同步 
机 制 。 

multiprocessing 模块 提供 了 三 种 机 制 实现 进程 同步 : multiprocess.Lock、multiprocess.Semaphore 、 
Imultiprocess.Event。 


1. multiprocess.Lock: 锁 
下 面 给 出 一 段 多 进程 抢占 输出 资源 实例 ， 具 体 代码 如 下 。 
import os 
import time 
import random 
from multiprocessing import Process 
def work(n) : 
print('%s: %s is running' %(n,os.getpid())) 
time.sleep (random. random()) 
print('%s:%s is done' %(n,os.getpid())) 
if _name =="' main _': 
for i in range(3): 
p=Process (target=work, args=(i,)) 
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上 面 的 代码 并 没有 实现 同步 ， 因 此 不 一 定 谁 先 抢 到 执行 权 。 
下 面 给 出 一 段 通 过 锁 进行 进程 同步 的 实例 ， 具 体 代码 如 下 。 


上 面 这 种 情况 虽然 使 用 加 锁 的 形式 实现 了 顺序 的 执行， 但 是 程序 又 重新 变 成 串 行 了 ， 这 样 确实 会 浪费 
时 间 ， 却 保证 了 数据 的 安全 。 

虽然 可 以 用 文件 共享 数据 实现 进程 间 通 信 ， 但 问题 是 .效率 低 (共享 数据 基于 文件 ， 而 文件 是 硬盘 上 
的 数据 )， 需 要 自己 加 锁 处 理 。 

2. multiprocess.Semaphore: 信号 量 


互 斥 锁 同时 只 允许 一 个 线程 更 改 数据 ， 而 信号 量 Semaphore 是 同时 允许 一 定数 量 的 线程 更 改 数据 。 
信号 量 同步 基于 内 部 计数 器 ， 每 调用 一 次 acquire0， 计 数 器 减 1， 每 调用 一 次 release0， 计 数 器 加 1; 
当 计 数 器 为 0 时 ，acquire0 调 用 被 阻塞 。 这 是 Dijkstra 信号 量 概念 PO 和 VO 的 Python 实现 。 信 号 量 同步 机 
制 适用 于 访问 像 服务 器 这 样 的 有 限 资源 。 
信号 量 与 进程 池 的 概念 很 像 ， 但 是 要 区 分 开 ， 信 号 量 涉及 加 锁 的 概念 
下 面 给 出 一 段 通过 信号 量 进行 进程 同步 的 实例 ， 具 体 代码 如 下 。 
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3. multiprocess.Event: 事件 


了 Python 线程 的 事件 用 于 主线 程控 制 其 他 线程 的 执行 ， 事 件 主要 提供 了 三 个 方法 set、wait、clear。 
事件 处 理 的 机 制 : 全 局 定义 了 一 个 “Flag”， 如 果 “Flag” 值 为 False， 那 么 当 程序 执行 event.wait 方法 
时 就 会 阻塞 ， 如 果 “Flag” 值 为 True， 那 么 执行 event.wait 方法 时 便 不 再 阻塞 。 
clear: 将 “Flag” 设 置 为 False。 
set: 将 “Flag” 设 置 为 True。 
下 面 给 出 一 段 通过 事件 进行 进程 同步 的 实例 ， 具 体 代码 如 下 。 
from multiprocessing import Process, Event 
import time, random 
def carle, n): 
while True: 


if not e.is_ set(): # 进 程 刚 开启 ,is_set() 的 值 是 False, 模拟 信号 灯 为 红色 
print ('\033[31m 红 灯 亮 \033 [0m, carg%s 等 着 ' $ D) 
e.wait() # 阻 塞 ,等 待 15_set () 的 值 变 成 True, 模拟 信号 灯 为 绿色 


print ('\033[32m 车 $s 绿灯 亮 了 \033[Om' % D) 
time.sleep (random.randint (3, 6)) 
if not e.is_ set():  # 如 果 is_set() 的 值 是 False, 也 就 是 红 灯 , 仍 然 回 到 while 语句 开始 
continue 
print (" 际 过 ~ ~，car'，n) 
break 
def police carle, n): 
while True: 
if not e.is_set() :# 进 程 刚 开启 , is_set () 的 值 是 False, 模拟 信号 灯 为 红色 
print ('\033[31m 红 灯 亮 \033[0m, car%s 等 着 ' % n) 
上 # 阻 塞 ， 等待 设置 等 待 时 间 , 等待 0.1s 之 后 没有 等 到 绿灯 就 闻 红 灯 走 了 
e.wait (0.1) 
if not e.is set(): 
print ('\033[33m 红 灯 , 警 车 飞 过 \033 [0m,car %s' % n) 
else: 
print ('\033[33;46m 绿灯 ,警车 正常 通过 \033 [Om, car %s' % n) 
break 
def traffic lights(e, inverval): 
while True: 
time.sleep (inverval) 
if e.is set(): 
print ('######', e.is set()) 
e.clear() #----> 将 is_set () 的 值 设 置 为 False 
else: 
e.set()  #----> 将 is_set() 的 值 设置 为 True 
print('*********#**, ©.is set()) 
if name =="' main _': 
e = Event() 
for i in range(10): 
p=Process (target=car,args=(e,i,)) # 创 建 10 个 进程 控制 10 辆 车 
p.start () 
for i in range(5): 


p = Process (target=police car，args=(e，i,)) # 创 建 5 个 进程 控制 5 辆 警车 


p.start () 
七 = Process (target=traffic lights，args=(e，10)) # 创 建 一 个 进程 控制 红绿灯 
七 .start () 
print ('============》') 
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14.2 ”线程 
线程 属于 进程 的 一 部 分 ， 它 不 能 独立 运行 ， 需 要 依附 于 一 个 进程 中 才 可 以 运行 。 
14.2.1 线程 基础 


在 讲解 线程 之 前 ， 需 要 先 了 解 几 个 跟 线 程 相关 的 概念 : 线程 状态 、 线 程 同步 、 线 程 通 信 、 线 程 运行 和 
阻塞 的 状态 转换 。 

1. 线程 状态 

线程 在 整个 生命 周期 中 有 5 种 状态 ， 状 态 转换 的 过 程 如 图 14-2 所 示 。 

2. 线程 同步 

多 线程 的 优势 在 于 可 以 同时 运行 多 个 任务 (但 实际 它们 是 交替 运行 的 )。 但 是 当 线 程 需 要 共享 数据 时 ， 
可 能 存在 数据 不 同步 的 问题 。 考 虑 这 样 一 种 情况 : 火车 票 销售 系统 ， 假 设 每 个 出 票 窗口 都 是 一 个 线程 ( 子 
线程 )， 同 时 从 服务 器 获取 现 有 车 票数 量 〈 共 享 数据 )， 如 果 没 有 线程 同步 可 能 会 销售 出 同名 车 票 。 

锁 有 两 种 状态 一 一 锁定 和 未 锁定 。 每 当 一 个 线程 例如 售票 线程 要 访问 共享 数据 时 ， 必 须 先 获得 锁定 ; 
如 果 已 经 有 别 的 线程 例如 一 个 售票 窗口 获得 锁定 了 ， 那 么 就 让 其 他 售票 窗口 线程 暂停 ， 也 就 是 同步 阻塞; 
等 到 线程 访问 完毕 ， 释 放 锁 以 后 ， 再 让 线程 继续 。 经 过 这 样 的 处 理 ， 可 以 保证 每 一 个 售票 窗口 拿 到 的 车 票 
是 唯一 的 。 

线程 与 锁 的 交互 如 图 14-3 所 示 。 


| 满足 阳 究 条 件 


阳 案 


14-2 ”线程 的 5 种 状态 14-3 ”线程 与 锁 


3. 线程 通信 

还 有 一 种 情况 ， 共 享 数据 并 不 是 一 开始 就 有 的 ， 而 是 通过 线程 create 创建 的 。 如 果 售票 窗口 在 create 
还 没有 运行 的 时 候 就 访问 共享 数据 ， 将 会 出 现 一 个 异常 。 使 用 锁 可 以 解决 这 个 问题 ， 但 是 售票 窗口 将 需要 
一 个 无 限 循环 一 一 他 们 不 知道 create 什么 时 候 会 运行 ， 让 create 在 运行 后 通知 售票 窗口 显然 是 一 个 更 好 的 
解决 方案 。 于 是 ， 引 入 了 条 件 变 量 。 

条 件 变量 允许 线程 在 条 件 不 满足 的 时 候 等 待 ， 等 到 条 件 满足 的 时 候 发 出 一 个 通知 ， 告 诉 售票 窗口 车 票 
已 经 有 了 ， 可 以 进行 售卖 了 。 

线程 与 条 件 变量 的 交互 ， 等 待 通知 锁定 如 图 14-4 所 示 。 
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图 14-4 等 待 通知 锁定 
线程 与 条 件 变量 的 交互 ， 执 行 完毕 释放 如 图 14-5 所 示 。 
4. 线程 运行 和 阻塞 的 状态 转换 
下 面 给 出 一 张 运行 阻塞 的 状态 图 ， 看 看 线程 运行 和 阻塞 状态 的 转换 ， 如 图 14-6 所 示 。 


图 14-5 执行 完毕 图 14-6 ”运行 阻塞 


阻塞 有 以 下 三 种 情况 。 

(1) 同步 阻塞 是 指 处 于 竞争 锁定 的 状态 ， 线 程 请 求 锁定 时 将 进入 这 个 状态 ， 一 旦 成 功 获得 锁定 又 恢复 
到 运行 状态 ; 

(2) 等 待 阻 塞 是 指 等 待 其 他 线程 通知 的 状态 ， 线 程 获得 条 件 锁定 后 ， 调 用 “等 待 ”将 进入 这 个 状态 ， 
一 旦 其 他 线程 发 出 通知 ， 线 程 将 进入 同步 阻塞 状态 ， 再 次 竞争 条 件 锁定 ; 

(3) 而 其 他 阻塞 是 指 调用 time.sleepO0、anotherthread,join0 或 等 待 IO 时 的 阻塞 ,这 个 状态 下 线程 不 会 释 
放 已 获得 的 锁定 。 


回 
14.2.2 ”Thread 类 
了 Python 通过 两 个 标准 库 thread 和 threading 提供 对 线程 的 支持 。thread 提供 了 低级 别 的 、 原 始 的 线程 以 


及 一 个 简单 的 锁 。 
下 面 给 出 一 个 使 用 thread 实现 多 线程 的 实例 ， 具 体 代 码 如 下 。 
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import thread 
import time 
# 一 个 用 于 在 线程 中 执行 的 函数 
def func(): 

for i in range(5): 

Print "func'" 
time.sleep(1) 

# 结 束 当前 线程 

# 这 个 方法 与 thread.exit_ thread () 等 价 

thread.exit () # 当 func 返回 时 ,线程 同样 会 结束 
# 启 动 一 个 线程 ,线程 立即 开始 运行 
# 这 个 方法 与 thread.start_new_thread () 等 价 
4# 第 一 个 参数 是 方法 ,第 二 个 参数 是 方法 的 参数 
thread.start_new(func，()) # 方 法 没有 参数 时 需要 传 入 空 tuple 
## 创 建 一 个 锁 ( LockType, 不 能 直接 实例 化 ) 
# 这 个 方法 与 thread.allocate_lock() 等 价 
lock = thread.allocate() 
# 判 断 锁 是 锁定 状态 还 是 释放 状态 
print lock.locked() 
上 # 锁 通常 用 于 控制 对 共享 资源 的 访问 
count = 0 
# 获 得 锁 ,成功 获 得 锁定 后 返回 True 
# 可 选 的 timeout 参数 不 填 时 将 一 直 阻 塞 直 到 获得 锁定 
# 否 则 超时 后 将 返回 False 
if lock.acquire() : 

count += 1 

+# 肢 放 锁 

lock.release() 
#thread 模块 提供 的 线程 都 将 在 主线 程 结束 后 同时 结束 
time.sleep(6) 


thread 模块 提供 的 其 他 方法 如 下 。 
thread.interrupt_ main0: 在 其 他 线程 中 终止 主线 程 。 
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thread.get ident0: 获得 一 个 代表 当前 线程 的 魔法 数字 ， 常 用 于 从 一 个 字典 中 获得 线程 相关 的 数据 。 这 


个 数字 本 身 没 有 任何 含义 ， 并 且 当 线程 结束 后 会 被 新 线程 复 用 。 


thread 还 提供 了 一 个 ThreadLocal 类 用 于 管理 线程 相关 的 数据 ， 名 为 thread._local，threading 中 引用 了 


这 个 类 。 


由 于 thread 提供 的 线程 功能 不 多 ， 无 法 在 主线 程 结束 后 继续 运行 ， 不 提供 条 件 变量 等 原因 ， 一 般 不 使 


用 thread 模块 。 
14.2.3 threading 模块 


threading 基于 Java 的 线程 模型 设计 。 锁 (Lock) 和 条 件 变量 (Condition) 在 Java 中 是 对 象 的 基本 行为 
(每 一 个 对 象 都 自 带 了 锁 和 条 件 变量 )， 而 在 Python 中 则 是 独立 的 对 象 。Python Thread 提供 了 Java Thread 


的 行为 的 子 集 ; 没有 优先 级 、 线程 组 , 线程 也 不 能 被 停止 、 暂停 、 恢复 、 中 断 。 Java Thread 中 
实现 了 的 静态 方法 在 threading 中 以 模块 方法 的 形式 提供 。 

threading 模块 提供 的 常用 方法 如 下 。 

threading.currentThread0: 返回 当前 的 线程 变量 。 


的 部 分 被 Python 


threading.enumerate0: 返回 一 个 包含 正在 运行 的 线程 的 list。 正 在 运行 是 指 线程 启动 后 、 结 束 前 ， 不 包 
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括 启动 前 和 终止 后 的 线程 。 


threading.activeCount0: 返回 正在 运行 的 线程 数量 ， 与 len(threading.enumerate0) 有 相同 的 结果 。 
threading 模块 提供 以 下 几 个 。 


Thread, Lock, RLock, Condition, [Bounded] Semaphore，Event，Timer，1ocal 


1. Thread 

Thread 是 线程 类 , 与 Java 类 似 , 有 两 种 使 用 方法 : 直接 传 入 要 运行 的 方法 或 从 Thread 继承 并 覆盖 run()。 
(1) start( 方 法 ， 开始 线程 活动 。 

对 每 一 个 线程 对 象 来 说 它 只 能 被 调用 一 次 ， 它 安排 对 象 在 一 个 另外 的 单独 线程 中 调用 run0 方 法 (而 非 


当前 所 处 线程 )。 


当 该 方法 在 同一 个 线程 对 象 中 被 调用 超过 一 次 时 ， 会 引入 RuntimeError〈 运 行 时 错误 )。 
(2) mn0 方 法 : 代表 了 线程 活动 的 方法 。 
可 以 在 子 类 中 重 写 此 方法 。 标 准 un0 方 法 调用 了 传递 给 对 象 的 构造 函数 的 可 调 对 象 作为 目标 参数 ， 如 


果 有 这 样 的 参数 的 话 ， 顺 序 和 关键 字 参 数 分 别 从 args 和 kargs 取得 。 


方法 1: 将 要 执行 的 方法 作为 参数 传 给 Thread 的 构造 方法 。 
def func(): 
print('func() passed to Thread') 
t = threading.Thread (target=func) 
七 .start () 


方法 2， 从 Thread 继承 ， 并 重 写 rn0。 


class MyThread (threading.Thread) : 
def run(self) : 
Print ('MYThread extended from Thread') 
t = MYThread () 
七 .start () 


构造 方法 : 

Thread (group=None, target=None, name=None, args=(), kwargs={}) 

group: 线程 组 ， 目 前 还 没有 实现 ， 库 引用 中 提示 必须 是 None。 

target: 要 执行 的 方法 。 

name: 线程 名 。 

args/kwargs: 要 传 入 方法 的 参数 。 

实例 方法 : 

isAlive0: 返回 线程 是 否 在 运行 。 正 在 运行 指 启动 后 、 终 止 前 。 

get/setName(name): 获取 /设置 线程 名 。 

is/setDaemon(booD): 获取 /设置 是 否 守 护 线程 。 初 始 值 从 创建 该 线程 的 线程 继承 。 当 没有 非 守护 线程 仍 


在 运行 时 ， 程 序 将 终止 。 


start0): 启动 线程 。 
join([timeout]): 阻塞 当前 上 下 文 环境 的 线程 ， 直 到 调用 此 方法 的 线程 终止 或 到 达 指 定 的 tmeout (可 选 


参数 )。 
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下 面 给 出 一 个 使 用 join 的 实例 ， 具 体 代码 如 下 。 
import threading 

import time 

def context (tJoin) : 
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2. Lock 


Lock (指令 锁 ) 是 可 用 的 最 低级 的 同步 指令 。Lock 处 于 锁定 状态 时 ， 不 被 特定 的 线程 拥有 。Lock 包含 
两 种 状态 一 一 锁 定 和 非 锁定 ， 以 及 两 个 基本 的 方法 。 

可 以 认为 Lock 有 一 个 锁定 池 ， 当 线程 请 求 锁定 时 ， 将 线程 置 于 池 中 ， 直 到 获得 锁定 后 出 池 。 池 中 的 线 
程 处 于 状态 图 中 的 同步 阻塞 状态 。 

构造 方法 : 
be 

实例 方法 : 

acquire([timeout]): 使 线程 进入 同步 阻塞 状态 ， 尝 试 获得 锁定 。 

release0: 释放 锁 。 使 用 前 线程 必须 已 获得 锁定 ， 否 则 将 抛 出 异常 。 
下 面 给 出 一 段 关 于 Lock 的 实例 ， 具 体 代 码 如 下 。 


3. RLock 
RLock (可 重 入 锁 ) 是 一 个 可 以 被 同一 个 线程 请 求 多 次 的 同步 指令 。RLock 使 用 了 “拥有 的 线程 ”和 
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“递归 等 级 ”的 概念 , 处 于 锁定 状态 时 , RLock 被 某 个 线程 拥有 .拥有 RLock 的 线程 可 以 再 次 调用 acquire0)， 
释放 锁 时 需要 调用 release0 相 同 次 数 。 


可 以 认为 RLock 包含 一 个 锁定 池 和 一 个 初始 值 为 0 的 计数 器 ， 每 次 成 功 调 用 acquireOHelease0， 计 数 


器 将 +1/-1， 为 0 时 锁 处 于 未 锁定 状态 。 


构造 方法 : 
RLock () 
实例 方法 : 
acquire([timeout])/release(): 跟 Lock 差不多 。 
下 面 给 出 一 段 关于 RLock 的 实例 ， 具 体 代码 如 下 。 
import threading 
import time 
rlock = threading.RLock() 
def func(): 
# 第 一 次 请 求 锁定 
print( '%s acquire lock...' % threading.currentThread() .getName ()) 
if rlock.acquire(): 
Print('%s get the lock.' % threading.currentThread() .getName () ) 
time.sleep (2) 
+# 第 二 次 请 求 锁定 
print('%s acquire lock again...' % threading.currentThread() .getName () ) 
if rlock.acquire(): 


print('%s get the lock.' % threading.currentThread() .getName () ) 
time.sleep(2) 


+ 第 一 次 释放 锁 
print('%s release lock...' % threading.currentThread () .getName () ) 
Flock.release () 
time.sleep (2) 
+ 第 二 次 释放 锁 
Print('%5 release lock...' % threading.currentThread() .getName () ) 
Flock.release () 
tl1 = threading.Thread (target=func) 
t2 = threading.Thread (target=func) 
t3 = threading.Thread (target=func) 
t1.start() 
t2.start() 
t3.start () 
4. Condition 


Condition 〈 条 件 变量 ) 通常 与 一 个 锁 关联 。 需 要 在 多 个 Contidion 中 共享 一 个 锁 时 ， 可 以 传递 一 个 


Lock/RLock 实例 给 构造 方法 ， 否 则 它 将 自己 生成 一 个 RLock 实例 。 


可 以 认为 ， 除 了 Lock 带 有 的 锁定 池 外 ，Condition 还 包含 一 个 等 待 地 ， 池 中 的 线程 处 于 状态 图 中 的 等 


待 阻 塞 状态 ， 直 到 另 一 个 线程 调用 notifyOmotifyAll0 通 知 ， 得 到 通知 后 线程 进入 锁定 池 等 待 锁定 。 


构造 方法 : 

Condition([lock/rlock]) 

实例 方法 : 

acquire([timeout])/release(): 调用 关联 的 锁 的 相应 方法 。 

wait([timeout]): 调用 这 个 方法 将 使 线程 进入 Condition 的 等 待 池 等 待 通知 ， 并 释放 锁 。 使 用 前 线程 必须 


已 获得 锁定 ， 否 则 将 抛 出 异常 。 


PP 


第 国 章 Python 线程 和 进程 


notify0: 调用 这 个 方法 将 从 等 待 池 挑选 一 个 线程 并 通知 ， 收 到 通知 的 线程 将 自动 调用 acquire0 尝 试 获 
得 锁定 〈 进 入 锁定 池 )， 其 他 线程 仍然 在 等 待 地 中 。 调 用 这 个 方法 不 会 释放 锁定 。 使 用 前 线程 必须 已 获得 锁 
定 ， 否 则 将 抛 出 异常 。 

notifyAll0: 调用 这 个 方法 将 通知 等 待 池 中 所 有 的 线程 ， 这 些 线程 都 将 进入 锁定 池 尝 试 获得 锁定 。 调 用 
这 个 方法 不 会 释放 锁定 。 使 用 前 线程 必须 已 获得 锁定 ， 否 则 将 抛 出 异常 。 

这 里 给 出 一 个 关于 生产 者 /消费 者 模式 的 实例 ， 具 体 代码 如 下 。 

import threading 

import time 


product = None 专 商 品 
con = threading.Condition() 专 条 件 变量 
def produce () : 志 生 产 者 方法 


global product 
if con.acquire(): 
while True: 
if product is None: 
print ('produce...') 
product = 'anything'" 
con.notify() # 通 知 消费 者 ,商品 已 经 生产 


con .wait () ## 等 待 通知 
time.sleep(2) 
def consume () : # 消 费 者 方法 


global product 
if con.acquire(): 
while True: 
if product is not None: 
print ('consume...') 
product = None 
con.notify() #4 通知 生产 者 ,商品 已 经 没 了 
con.wait () #4 等 待 通知 
time.sleep (2) 
tl = threading.Thread (target=produce) 
t2 = threading.Thread (target=consume) 
t2.start () 
t1.start() 


5. Semaphore/BoundedSemaphore 

Semaphore (信和 号 量 ) 是 计算 机 科学 史上 最 古老 的 同步 指令 之 一 。Semaphore 管理 一 个 内 置 的 计数 器 ， 
每 当 调用 aequire0 时 -1， 调 用 release0 时 +1。 计 数 器 不 能 小 于 0， 当 计数 器 为 0 时 ，acquire0 将 阻塞 线程 至 
同步 锁定 状态 ， 直 到 其 他 线程 调用 release0 。 
基于 这 个 特点 ，Semaphore 经 常用 来 同步 一 些 有 “访客 上 限 ” 的 对 象 ， 例 如 连接 池 。 

BoundedSemaphore 与 Semaphore 的 唯一 区 别 在 于 前 者 将 在 调用 release0 时 检查 计数 器 的 值 是 否 超过 了 
计数 器 的 初始 值 ， 如 果 超过 了 将 抛 出 一 个 异常 。 


构造 方法 : 
Semaphore(value=1): value 是 计数 器 的 初始 值 。 
实例 方法 : 


acquire([timeout]): 请 求 Semaphore。 如 果 计 数 器 为 0， 将 阻塞 线程 至 同步 阻塞 状态 ， 否 则 将 计数 器 -1 
并 立即 返回 。 
release0: 释放 Semaphore, 将 计数 器 +1, 如 果 使 用 BoundedSemaphore, 还 将 进行 : 释放 次 数 检查 。 release() 
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方法 不 检查 线程 是 否 已 获得 Semaphore。 


下 面 给 出 一 段 关 于 Semaphore 的 实例 ， 具 体 代 码 如 下 。 
import threading 
import time 
二 计数 器 初 值 为 2 
semaphore = threading.Semaphore(2) 
def func(): 
## 请 求 Semaphore, 成功 后 计数 器 -1; 计数 器 为 0 时 阻塞 
print('%s acquire semaphore...' $% threading.currentThread () .getName()) 
if semaphore.acquire(): 
print('%s get semaphore' $% threading.currentThread() .getName () ) 
time.sleep(4) 
# 释 放 Semaphore, 计数 器 +1 
print('%s release semaphore' $% threading.currentThread() .getName() ) 
semaphore.release() 
threading.Thread (target=func) 
threading.Thread (target=func) 
七 3 threading.Thread (target=func) 
七 4 threading.Thread (target=func) 
tl1.start() 
t2.start() 
t3.start() 
t4.start () 
time.sleep(2) 
# 没 有 获得 semaphore 的 主线 程 也 可 以 调用 release 
# 若 使 用 Boundedsemaphore,t4 释放 semaphore 时 将 抛 出 异常 
print('MainThread release semaphore without acquire') 
semaphore.release() 


6. Event 
Event (事件 ) 是 最 简单 的 线程 通信 机 制 之 一 ， 它 是 一 个 线程 通知 事件 ， 其 他 线程 等 待 事件 。Event 内 


七 1 
七 2 


置 了 一 个 初始 为 False 的 标识 ， 当 调用 set0 时 设 为 True， 调 用 clear0 时 重 置 为 False。wait0 将 阻塞 线程 至 等 
待 阻塞 状态 。 


214 


Event 其 实 是 一 个 简化 版 的 Condition。Event 没有 锁 ， 无 法 使 线程 进入 同步 阻塞 状态 。 
构造 方法 : 
Event () 
实例 方法 : 
isSet0: 当 内 置 标识 为 Trme 时 返回 Trme。 
set0: 将 标识 设 为 Tme， 并 通知 所 有 处 于 等 待 阻 塞 状态 的 线程 恢复 运行 状态 。 
clear0: 将 标识 设 为 False。 
wait([timeout]): 如 果 标 识 为 True 将 立即 返回 , 否则 阻塞 线程 至 等 待 阻塞 状态 , 等 待 其 他 线程 调用 set0。 
下 面 给 出 一 段 关 于 Event 的 实例 ， 具 体 代码 如 下 。 
import threading 
import time 
event = threading.Event () 
def func(): 
# 等 待 事件 ,进入 等 待 阻塞 状态 
print('%s wait for event...' % threading.currentThread () .getName () ) 


event .wait () 


# 收 到 事件 后 进入 运行 状态 
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7. Timer 
Timer (定时 器 ) 是 Thread 的 派生 类 ， 用 于 在 指定 时 间 后 调用 一 个 方法 。 
构造 方法 : 


interval: 指定 的 时 间 。 

function: 要 执行 的 方法 。 

args/kwargs: 方法 的 参数 。 

实例 方法 : 

Timer 从 Thread 派生 ， 没 有 增加 实例 方法 。 


8. local 
local 是 一 个 小 写字 母 开头 的 类 ， 用 于 管理 thread-local (线程 局 部 的 ) 数据 。 对 于 同一 个 local， 线程 无 
法 访问 其 他 线程 设置 的 属性 ， 线 程 设 置 的 属性 不 会 被 其 他 线程 设置 的 同名 属性 替换 。 
可 以 把 local 看 成 是 一 个 “线程 -属性 字典 ”的 字典 ，local 封装 了 从 自身 使 用 线程 作为 key 检索 对 应 的 
属性 字典 ， 再 使 用 属性 名 作为 key 检索 属性 值 的 细节 。 


熟练 掌握 Thread、Lock、Condition 就 可 以 应 对 绝 大 多 数 需要 使 用 线程 的 场合 ， 某 些 情况 下 local 也 是 
非常 有 用 的 东西 。 本 文 的 最 后 使 用 这 几 个 类 展示 线程 基础 中 提 到 的 场景 。 
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alist[i] = 1 
condition.release() 
def doPrint(): 
if condition.acquire(): 
while alist is None: 
condition.wait () 
for i in alist: 
print i, 
print 
condition.release() 
def docreate(): 
global alist 
if condition.acquire(): 
if alist is None: 
alist = [0 for i in range(10)] 
condition.notifyAll () 
condition.release() 
tset = threading.Thread (target=doset, name='tset') 
tprint = threading.Thread (target=doPrint, name="'tprint') 
tcreate = threading.Thread (target=doCreate, name='tcreate') 
tset.start() 
tprint.start () 
tcreate.start () 


14.3 ”就 业 面试 技巧 与 解析 


本 章 讲解 了 Python 中 有 关 进 程 与 线程 的 概念 ， 在 面试 中 多 线程 一 直 都 是 面试 必 考 的 内 容 ， 因 此 读者 应 
该 熟练 掌握 多 进程 多 线程 的 几 种 机 制 ， 并 熟练 使 用 多 线程 进行 开发 ， 深 刻 理解 不 同 进程 线程 同步 的 优 劣 。 


14.3.1 面试 技巧 与 解析 (一) 


面试 官 : Python 中 如 何 实现 多 线程 ? 

应 聘 者 : 线程 是 轻 量 级 的 进程 ， 多 线程 允许 一 次 执行 多 个 线程 。 众 所 周知 ，Python 是 一 种 多 线程 语言 ， 
它 有 一 个 多 线程 包 。 

GIL (全 局 解释 器 锁 ) 确保 一 次 执行 单个 线程 。 一 个 线程 保存 GIL 并 在 将 其 传递 给 下 一 个 线程 之 前 执 
行 一 些 操作 ， 这 就 产生 了 并 行 执行 的 错觉 。 但 实际 上 ， 只 是 线程 轮流 在 CPU 上。 当然 ， 所 有 传递 都 会 增加 
执行 的 开销 。 


14.3.2 面试 技巧 与 解析 〈 二 ) 


面试 官 : 创建 两 个 线程 ， 其 中 一 个 输出 1 一 52， 另 外 一 个 输出 A 一 Z。 输 出 格式 要 求 : 
12A 34B 56C 78D。 

应 聘 者 : 

import threading 

import time 


+ 获取 对 方 的 锁 , 运行 一 次 后 ,释放 自己 的 锁 
def showl1() : 
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第 15 章 
Python 异常 处 理 


二 > 学 习 指 引 
本 章 讲解 Python 中 的 异常 处 理 ， 异 常 顾名思义 是 指 意外 不 可 控 的 一 些 因素 引起 的 程序 前 溃 。 


二 ”重点 导读 


“了 解 异 常 的 概念 。 
“掌握 异常 的 处 理 方法 。 
“掌握 常见 的 标准 异常 。 

* 掌握 手动 抛 出 异常 的 方法 。 


15.1 异常 概述 


异常 即 是 一 个 事件 ， 该 事件 会 在 程序 执行 过 程 中 发 生 ， 影 响 程 序 的 正常 执行 。 一 般 情况 下 ， 在 Python 
无 法 正常 处 理 程序 时 就 会 发 生 一 个 异常 。 异 常 是 Python 对象， 表示 一 个 错误 。 当 Python 脚本 发 生 异常 时 需 
要 捕获 处 理 它 ， 否 则 程序 会 终止 执行 。 

Python 中 的 标准 异常 见 表 15-1。 


表 15-1 标准 异常 
异常 名 称 描述 
BaseException 所 有 异常 的 基 类 
SystemExit 解释 器 请 求 退出 
KeyboardInterrupt 用 户 中 断 执行 〈 通 常 是 输入 ^C) 
Exception 常规 错误 的 基 类 
StopIteration 迭代 器 没有 更 多 的 值 
GeneratorExit 生成 器 (generator) 发 生 异常 来 通知 退出 
StandardError 所 有 的 内 建 标准 异常 的 基 类 


ArithmeticError 所 有 数值 计算 错误 的 基 类 
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续 表 

异常 名称 描 述 
FloatingPointError 浮 点 计算 错误 
OverflowError 数值 运算 超出 最 大 限制 
ZeroDivisionError 除 (或 取 模 ) 零 (所 有 数据 类 型 ) 
AssertionError 断言 语句 失败 
AttributeError 对 象 没 有 这 个 属性 
EOFError 没有 内 建 输入 ， 到 达 EOF 标记 
EnvironmentError 操作 系统 错误 的 基 类 
IOError 输入 /输出 操作 失败 
OSError 操作 系统 错误 
WindowsError 系统 调用 失败 
ImportError 导入 模块 /对 象 失败 
LookupError 无 效 数据 查询 的 基 类 
IndexError 序列 中 没有 此 索引 (index) 
KeyError 映射 中 没有 这 个 键 
MemoryError 内 存 溢出 错误 (对 于 Python 解释 器 不 是 致命 的 ) 
NameError 未 声明 /初始 化 对 象 没有 属性 ) 
UnboundLocalError 访问 未 初始 化 的 本 地 变量 
ReferenceError 能 引用 试图 访问 已 经 垃圾 回收 了 的 对 象 
RuntimeError 一 般 的 运行 时 错误 
NotImplementedError 尚未 实现 的 方法 
SyntaxError Python 语法 错误 
IndentationError 缩 进 错误 
TabError Tab 和 空格 混用 
SystemError 一 般 的 解释 器 系统 错误 
TypeError 对 类 型 无 效 的 操作 
ValueError 传 入 无 效 的 参数 
UnicodeError Unicode 相关 的 错误 
UnicodeDecodeError Unicode 解码 时 的 错误 
UnicodeEncodeError Unicode 编码 时 错误 
UnicodeTranslateError Unicode 转换 时 错误 
Warning 警告 的 基 类 
DeprecationWarning 关于 被 弃 用 的 特征 的 警告 
FutureWarning 关于 构造 将 来 语义 会 有 改变 的 警告 
OverflowWaming 旧 的 关于 自动 提升 为 长 整 型 的 警告 
PendingDeprecationWaming 关于 特性 将 会 被 废弃 的 警告 
RuntimeWarning 可 疑 的 运行 时 行为 的 警告 
SyntaxWarning 可 疑 的 语法 的 警告 
UserWarning 用 户 代码 生成 的 警告 
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15.2 异常 的 处 理 


捕捉 异常 可 以 使 用 try/except 语句 。try/except 语句 用 来 检测 try 语句 块 中 的 错误 ， 从 而 让 except 语句 捕 
获 异常 信息 并 处 理 。 
回 


15.2.1 ”异常 基础 

异常 的 一 些 基本 概念 以 及 异常 的 处 理 方法 。 

1. 什么 是 异常 

异常 发 生 之 后 ， 异 常 之 后 的 代码 就 不 执行 了 。 

2. 什么 是 异常 处 理 

Python 解释 器 检测 到 错误 ， 触 发 异常 (也 人 允许 程序 员 自 己 触发 异常 )， 程序 员 编写 特定 的 代码 ， 专 门 用 
来 捕捉 这 个 异常 (这 段 代码 与 程序 逻辑 无 关 ， 与 异常 处 理 有 关 )， 如 果 捕 捉 成 功 则 进入 另外 一 个 处 理 分 支 ， 
执行 为 其 定制 的 逻辑 ， 使 程序 不 会 崩溃， 这 就 是 异常 处 理 。 

3. 为 什么 要 进行 异常 处 理 

Python 解析 器 去 执行 程序 ， 检 测 到 一 个 错误 时 ， 触 发 异常 ， 异 常 触发 后 且 没 被 处 理 的 情况 下 ， 程 序 就 
在 当前 异常 处 终止 ， 后 面 的 代码 不 会 运行 。 谁 会 去 用 一 个 运行 着 突然 就 崩溃 的 软件 ?所 以 必须 提供 一 种 异 
常 处 理 机 制 ， 以 此 来 增强 程序 的 健壮 性 与 容错 性 。 


5.2.2 异常 处 理 的 基本 语法 


如 果 不 想 在 异常 发 生 时 结束 程序 ， 只 需 在 try 里 捕获 它 。 
以 下 为 简单 的 ty…except…else 的 语法 : 


try: 


< 语句 > 4 运行 别 的 代码 

except < 名 字 >: 

< 语句 > 上 如 果 在 try 部 分 引发 了 异常 
except < 名 字 >, < 数据 >: 

< 语句 > 4 如 果 引 发 了 异常 ,获得 附加 的 数据 
else: 

< 语句 > # 如 果 没有 异常 发 生 


try 的 工作 原理 是 ， 当 开始 一 个 try 语句 后 ，Python 就 在 当前 程序 的 上 下 文中 做 标记 ， 这 样 当 异常 出 现 
时 就 可 以 回 到 这 里 ，try 子 句 先 执行 ， 接 下 来 会 发 生 什 么 依赖 于 执行 时 是 否 出 现 异常 。 

如 果 当 try 后 的 语句 执行 时 发 生 异 常 ，Python 就 跳 回 到 try 并 执行 第 一 个 匹配 该 异常 的 except 子 句 ， 异 
常 处 理 完毕 ， 控 制 流 就 通过 整个 try 语句 (除非 在 处 理 异 常 时 又 引发 新 的 异常 )。 

如 果 在 try 后 的 语句 里 发 生 了 异常 ， 却 没有 匹配 的 except 子 句 ， 异 常 将 被 递交 到 上 层 的 ty， 或 者 到 程 
序 的 最 上 层 (这 样 将 结束 程序 ， 并 打印 默认 的 出 错 信息 )。 

如 果 在 try 子 句 执行 时 没有 发 生 异常 ，Python 将 执行 else 语句 后 的 语句 (如 果 有 else 的 话 )， 然 后 控制 
流通 过 整个 try 语句 。 

下 面 给 出 一 个 打开 文件 的 案例 ， 在 该 文件 中 的 内 容 写 入 内 容 ， 且 并 未 发 生 异常 ， 具 体 代码 如 下 。 


try: 
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fh = open("testfile", "w") 
fh.write ("这 是 一 个 测试 文件 ,用 于 测试 异常 1 1") 
except IOError: 
print ("Error: 没有 找到 文件 或 读 取 文件 失败 ") 
else: 
print ("内 容 写 入 文件 成 功 ") 
fh.close() 
接着 上 例 ， 同 样 是 打开 一 个 文件 ， 在 该 文件 中 写 入 内 容 ， 但 文件 没有 写 权 限 ， 发 生 异常 依然 使 用 上 
的 代码 ， 为 了 测试 方 ee 
Windows 系统 修改 文件 权限 命令 如 


cacls testfile /t /e /c /d administrator 


Linux 系统 修改 文件 权限 命令 如 


chmod -w testfile 


15.2.3 ”异常 及 处 理 


首先 须知 ， 异 常 是 由 程序 的 错误 引起 的 ， 语 法 上 的 错误 跟 异常 处 理 无关 ， 必须 在 程序 运行 前 进行 修正 。 

通过 站 判断 方式 处 理 异常 : 

numl=input ('>>: ') # 输 入 一 个 字符 串 试 试 

if numl.isdigit() : 

int (numl) 4 我 们 的 正统 程序 放 到 了 这 里 ， 其余 的 都 属于 异常 处 理 范畴 
elif numl.isspace() : 

print (' 输 入 的 是 空格 ,就 执行 我 这 里 的 逻辑 ') 
elif len(numl) == 0: 

print (" 输 入 的 是 空 ,就 执行 我 这 里 的 逻辑 ') 
else: 

print(" 其 他 情况 ,执行 我 这 里 的 逻辑 ') 

这 样 处 理 的 缺点 ， 使 用 站 的 方式 只 为 第 一 段 代码 加 上 了 异常 处 理 ， 但 这 些 if 与 代码 逻辑 并 无 关系 ， 这 
样 的 代码 会 因为 可 读 性 差 而 不 容易 被 看 懂 。 这 只 是 代码 中 的 一 个 小 逻辑 ， 如 果 类 似 的 逻辑 多 ， 那 么 每 一 次 
都 需要 判断 这 些 内 容 ， 就 会 导致 我 们 的 代码 特别 见长 。 

通过 上 面 的 处 理 总 结 如 下 。 

(1) f 判断 式 的 异常 处 理 只 能 针对 某 一 段 代码 ， 对 于 不 同 的 代码 段 的 相同 类 型 的 错误 需要 写 重复 的 并 
来 进行 处 理 。 

(2) 在 实际 的 程序 中 频繁 地 写 与 程序 本 身 无 关 而 与 异常 处 理 有 关 的 ff,， 会 使 得 代码 可 读 性 降低 。 

站 是 可 以 解决 异常 的 ， 只 是 存在 以 上 两 个 问题 。 

def test(): 

print('test running') 
choice dic={ 
'1':test 
while True: 
choice=input ('>>: ').strip() 
if not choice or choice not in choice dic:continue # 这 便 是 一 种 异常 处 理 机 制 
choice dic[choice] () 
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15.3 ”Python 常见 标准 异常 


了 Python 为 每 一 种 异常 定制 了 一 个 类 型 ， 然 后 提供 了 一 种 特定 的 语法 结构 用 来 进行 异常 处 理 。 


15.3.1 处理 ZeroDivisionError 


除数 为 0 的 异常 ， 这 是 一 个 数学 常识 ， 如 果 在 数学 运算 中 没有 考虑 这 样 一 个 因素 就 有 可 能 引发 这 样 一 
个 异常 。 
try: 
print (5/0) 
except ZeroDivisionError:#'ZeroDivisionError' 除 数 等 于 0 的 报错 方式 
print ("You can't divide by zero!" ) 
运用 了 异常 处 理 ， 就 不 会 出 现 traceback。 
下 面 给 出 一 个 例子 : 
print ("Enter two numbers.") 
print ("Enter 'q' to quit.") 
while True: 
first number = input ("first number:") 
if first number == 'q': 


break 
second_ number = input ("second number:") 
if second number == 'q': 

break 
try: 


result = int(first number)/int (second number) 
except ZeroDivisionError: 

print ("You can't divide by 0.") 
else: #4 依赖 于 try… 执 行 成 功 的 放 入 e 


15.3.2 ”使 用 异常 避免 月 省 


发 生 错误 时 ， 如 果 程序 还 有 工作 没有 完成 ， 妥 善 地 处 理 错误 就 尤其 重要 。 这 种 情况 经 常会 出 现在 要 求 用 
户 提供 输入 的 程序 中 ， 如 果 程 序 能 够 受 善 地 处 理 无 效 输入 ， 就 能 再 提示 用 户 提供 有 效 输入 ， 而 不 至 于 崩溃 。 
Print("Give me two numbers, and I'11 divide them.") 
print ("Enter 'q' to quit.") 
while True: 
first_ number = input ("\nFirst number: ") 


if first number == 'q': 

break 
second number = input ("second number: ") 
if second number == 'q': 

break 


answer = int(first number) / int(second number) 
print (answer) 


这 个 程序 没有 采取 任何 处 理 错误 的 措施 ， 因 此 让 它 执 行 除数 为 0 的 除法 运算 时 ， 它 将 崩溃 。 
程序 崩溃 会 给 用 户 带 来 操作 不 友好 的 负面 效果 。 不 懂 技术 的 用 户 会 被 它们 搞 糊涂 ， 而 且 如 果 用 户 怀 有 
恶意 ， 他 会 通过 traceback 获悉 你 不 希望 他 知道 的 信息 。 例 如 ， 他 将 知道 你 的 程序 文件 的 名 称 ， 还 将 看 到 部 分 不 
能 正确 运行 的 代码 。 有 时 候 ， 训 练 有 素 的 攻击 者 可 根据 这 些 信息 判断 出 可 对 你 的 代码 发 起 什么 样 的 攻击 。 
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通过 将 可 能 引发 错误 的 代码 放 在 ty…except 代码 块 中 ， 可 提高 这 个 程序 抵御 错误 的 能 力 。 错 误 是 执行 
除法 运算 的 代码 行 导 致 的 ， 因 此 需要 将 它 放 到 try…except 代码 块 中 。 这 个 实例 还 包含 一 个 else 代码 块 ; 依 
赖 于 try 代码 块 成 功 执行 的 代码 都 应 放 到 else 代码 块 中 。 
print ("Give me two numbers, and I'11 divide them.") 
print ("Enter 'q' to quit.") 
while True: 
first number = input("\nFirst number: ") 


if first number == 'q': 

break 
Second number = input ("second number: ") 
try: 


answer = int(first number) / int (second number) 
except ZeroDivisionError: 

print ("You can't divide by 0!") 
else: 

print (answer) 


让 Python 尝试 执行 ty 代码 块 中 的 除法 运算 , 这 个 代码 块 只 包含 可 能 导致 错误 的 代码 。 依赖 于 try 代码 
块 成 功 执行 的 代码 都 放 在 else 代码 块 中 。 在 这 个 实例 中 ， 如 果 除法 运算 成 功 ， 就 使 用 else 代码 块 来 打印 结 
果 。except 代码 块 告诉 Python, 出 现 ZeroDivisionError 异常 时 该 怎么 办 。 如果 try 代码 块 因 除 零 错误 而 失败 ， 
就 打印 一 条 友好 的 消息 ， 告 诉 用 户 如 何 避 免 这 种 错误 。 程 序 将 继续 运行 ， 用 户 根本 看 不 到 traceback。 


15.3.3 处理 FileNotFoundError 


文件 为 空 异 常 ， 这 在 操作 文件 中 也 经 常会 遇 到 。 
FileNotFoundError 的 处 理 代码 : 
filename = 'tom.txt' #tom 这 个 文件 是 不 存在 的 
try: 
with open(filename) as file: 
content = file.read() 


except FileNotFoundError: # 文 件 不 能 找到 的 异常 处 理 
print ("sorry!The file "+filename+" can't find.") 

第 一 个 实例 : 

filename = 'old man and sea.txt' # 这 里 的 文件 是 存在 的 

try: 


with open (filename, 'rb') as file: 注意 ; 这 里 的 阅读 模式 要 用 'rb' 以 二 进 制 的 形式 读 取 
contents = file.read() 
except FileNotFoundError: 
print ("sorry! We don't find "+filename+".") 


else: 
## 计 算 文件 大 概 有 多 少 单词 
words = contents.split() # 按 空格 位 拆 分 单词 


num words = len (words) 
print ("The file "+filename+" has about "+str (num Wwords)+" words.") 


第 二 个 实例 (使 用 函数 的 方式 ): 
def count words (filename) : 
yy 
with open (filename, 'rb') as file: 
contents = file.read() 


except FileNotFoundError: 
print ("sorry! We don't find " + filename + ".") 
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15.3.4 万 能 异常 Exception 
在 Python 的 异常 中 有 一 个 万 能 异常 Exception， 可 以 捕获 任意 异常 ， 即 : 


读者 可 能 会 说 既然 有 万 能 异常 ， 那 么 直接 用 上 面 的 这 种 形式 就 好 了 ， 其 他 异常 可 以 忽略 。 

说 的 没 错 ， 但 是 应 该 分 两 种 情况 去 看 。 

(1) 如 果 想 要 的 效果 是 ， 无 论 出 现 什么 异常 ， 统 一 丢弃 或 者 使 用 同一 段 代码 逻辑 去 处 理 ， 这 时 只 有 一 
个 Exception 就 足够 了 。 


如 果 统一 用 Exception， 没 错 ， 是 可 以 捕捉 所 有 异常 ， 但 意味 着 你 在 处 理 所 有 异常 时 都 使 用 同一 个 逻辑 
去 处 理 〈 这 里 说 的 逻辑 即 当前 expect 下 面 跟 的 代码 块 )。 

(2) 如 果 想 要 的 效果 是 ， 对 于 不 同 的 异常 需要 定制 不 同 的 处 理 逻 辑 ， 那 就 需要 用 到 多 分 支 了 。 

多 分 支 处 理 : 


多 分 支 TException: 
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print (e) 

except ValueError as e: 
print (e) 

except Exception as e: 
print (e) 

其 他 形式 的 异常 : 

Sl = "heilor 

try: 
int (s1) 

except IndexError as e: 
print (e) 

except KeyError as e: 
print (e) 

except ValueError as e: 
print (e) 

#except Exception as e: 

#4 print(e) 

else: 

print ('try 内 代码 块 没有 异常 则 执行 我 ') 

finally: 
print (' 无 论 异 常 与 否 ,都 会 执行 该 模块 ,通常 是 进行 清理 工作 ') 


15.3.5” 自 定义 异常 


Python 的 异常 分 为 两 种 : 一 种 是 内 建 异 常 ， 即 Python 自己 定义 的 异常 ， 另 一 种 是 用 户 自 定义 异常 ， 自 
定义 异常 扩展 了 异常 机 制 。 
首先 看 看 Python 的 异常 继承 树 ， 如 图 15-1 所 示 。 


Keyboardinterrupt Exception 
键 短 中断 异常 


NameError、ValueError，IOError，ImportError 


15-1 Python 的 异常 继承 树 


可 以 看 到 Python 的 异常 有 个 大 基 类 ， 然 后 继承 的 是 Exception。 所 以 自 定义 类 也 必须 继承 Exception。 
+ 最 简单 的 自 定义 异 党 


class FError (Exception): 
pass 


抛 出 异常 用 try…except: 


try: 
raise FError(" 自 定义 异常 ") 
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except FError as e: 
print (e) 
在 这 里 给 出 一 个 简单 的 自 定义 异常 类 模板 ， 具 体 代码 如 下 。 
class CustomError (Exception): 
def _ init (self,ErrorIinfo): 
super(). init (self) # 初 始 化 父 类 
Self.errorinfo=ErrorIinfo 
def str_ (self): 


return self.errorinfo 
if name ==" main _': 
try: 
raise CustomError(' 客 户 异 常 ') 
except CustomError as e: 


print (e) 


15.4 手动 抛 出 异常 


手动 抛 出 异常 属于 主动 设置 异常 ， 如 果 在 程序 出 现 异常 的 地 方 设置 手动 异常 ， 对 于 这 样 异 常 的 处 理 更 
有 针对 性 。 
| 


时 15.4.1 用 raise 手动 抛 出 异常 


当 程 序 出 错时 ，Python 会 自动 触发 异常 ， 也 可 以 通过 raise 显 式 引发 异常 ， 一 旦 执行 了 raise 语句 ，raise 
之 后 的 语句 将 不 再 执行 。 如 果 加 入 了 try…except， 那 么 except 里 的 语句 会 被 执行 。 

Taise 语法 格式 如 下 : 

raise [Exception [, args [, traceback]]] 

语句 中 Exception 是 异常 的 类 型 (例如 NameError)，args 是 一 个 异常 参数 值 。 该 参数 是 可 选 的， 如 果 不 
提供 ， 异 常 的 参数 是 None。 最 后 一 个 参数 是 可 选 的 在 实践 中 很 少 使 用 )， 如 果 存在 ， 是 跟踪 异常 对 象 。 

一 个 异常 可 以 是 一 个 字符 串 、 类 或 对 象 。Python 的 内 核 提 供 的 异常 ， 大 多 数 都 是 实例 化 的 类 ， 这 是 一 
个 类 的 实例 的 参数 。 

定义 一 个 异常 非常 简单 ， 如 下 所 示 。 

def functionName( level ) : 

if level < 1: 


raise Exception("Invalid level!", level) 


+ 触发 异常 后 , 后面 的 代码 就 不 会 再 执行 
注意 : 为 了 能 够 捕获 异常 ，except 语句 必须 用 相同 的 异常 来 抛 出 类 对 象 或 者 字符 串 。 
捕获 以 上 异常 ， except 语句 如 下 所 示 。 
try 


正常 逻辑 

except "Invalid level!": 
触发 自 定义 异 党 

else: 


其 余 代码 


226 


第 国 章 “Python 异常 处 理 


注意 : 手动 抛 出 的 异常 如 果 不 捕获 ， 同 样 会 中 断 程序 运行 。 
捕获 手动 抛 出 的 异常 : 


手动 抛 出 异常 一 assert 抛 出 异常 : 


自 定义 一 个 异常 并 抛 出 自 定义 异常 : 


15.4.2 assert 语句 


使 用 assert 是 学 习 Python 一 个 非常 好 的 习惯 ，Python 的 assert 语句 格式 及 用 法 很 简单 。 在 没完 善 一 个 
程序 之 前 ， 开 发 者 不 知道 程序 在 哪里 会 出 错 ， 与 其 让 它 在 运行 时 崩溃 ， 不 如 在 出 现 错误 条 件 时 就 崩溃 ， 这 
时 候 就 需要 assert 的 帮助 。 

assert 是 声明 其 布尔 值 必 须 为 真 的 判定 ,如 果 发 生 异 常 就 说 明 表 达 式 为 假 .可 以 理解 assert 语句 为 raise… 
论 'not， 用 来 测试 表达 式 ， 其 返回 值 为 假 ， 就 会 触发 异常 。 

assert 语句 的 语法 格式 : 

expression assert 表达 式 

下 面 给 出 一 些 assert 用 法 的 语句 供 参考 : 
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assert 的 异常 参数 ， 其 实 就 是 在 断言 表达 式 后 添加 字符 串 信息 ， 用 来 解释 断言 并 更 好 地 知道 是 哪里 出 了 
问题 。 格 式 如 下 : 

assert expression [, arguments] 

assert 表达 式 [， 参 数 ] 

assert len(lists) >=5, ' 列 表 元 素 个 数 小 于 5' 

assert 2==1, '2 不 等 于 1' 

总 结 : 

try…except 这 种 异常 处 理 机 制 就 是 取代 寺 ， 让 程序 在 不 牺牲 可 读 性 的 前 提 下 增强 健壮 性 和 容错 性 。 

异常 处 理 中 为 每 一 个 异常 定制 了 异常 类 型 (Python 中 统一 了 类 与 类 型 ， 类 型 即 类 )， 对 于 同一 种 异常 ， 
一 个 except 就 可 以 捕捉 到 ， 可 以 同时 处 理 多 段 代 码 的 异常 〈 无 须 写 多 个 让 判断 式 )， 减 少 了 代码 ， 增 强 了 
可 读 性 。 


15.5 ”就业 面试 技巧 与 解析 


异常 处 理 是 为 了 增强 程序 的 健壮 性 ， 如 果 一 个 程序 没有 异常 处 理 机 制 ， 可 能 会 导致 意外 崩溃 退出 ， 对 
于 一 个 使 用 者 来 说 是 无 法 容忍 的 ， 因 此 异常 处 理 在 程序 中 显得 尤为 重要 ， 这 么 重要 的 知识 点 面试 中 也 会 经 
常 被 问 到 。 


15.5.1 面试 技巧 与 解析 (一) 


面试 官 : 介绍 一 下 except 的 用 法 和 作用 。 
应 聘 者 : Python 的 except 用 来 捕获 所 有 异常 ， 因 为 Python 里 面 的 每 次 错误 都 会 抛 出 一 个 异常 ， 所 以 每 
个 程序 的 错误 都 被 当 作 一 个 运行 时 错误 。 


15.5.2 面试 技巧 与 解析 《二 ) 


面试 官 : Python 如 何 捕获 异常 ? 
应 聘 者 : Python 中 捕获 异常 可 以 有 三 种 方式 。 
(1) 使 用 try 和 except 语句 来 捕获 异常 ， 具 体 代码 如 下 。 


try: 


block 

except [exception, [data*…]]: 
block 

try: 

block 

except [exception, [data…]]: 
block 

else: 
block 


捕获 到 的 IOError 错误 的 详细 原因 会 被 放置 在 对 象 。 中 ， 然 后 运行 该 Python 异常 处 理 的 except 代码 块 
捕获 所 有 的 异常 。 
(2) 用 raise 语句 手动 引发 一 个 异常 ， 具 体 代码 如 下 。 
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(3) 采用 sys 模块 回溯 最 后 的 异常 ， 具 体 代码 如 下 。 
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WP 学 习 指引 


在 开发 软件 的 项 目 过程 中 ， 会 涉及 测试 和 打包 两 个 重要 的 环节 。 程 序 测试 是 指 对 一 个 完成 了 全 部 或 部 
分 功能 、 模 块 的 计算 机 程序 在 正式 使 用 前 的 检测 ， 以 确保 该 程序 能 按 预定 的 方式 正确 地 运行 。 开 发 者 可 以 
通过 测试 工具 对 程序 进行 测试 来 改进 代码 。 将 程序 进行 打包 ， 方 便 一 般 用 户 使 用 。 编 程 扩 展 是 方便 程序 开 
发 人 员 将 Python 与 其 他 编程 语言 结合 。 本 章 介 绍 Python 程序 开发 时 测试 与 打包 以 及 编程 扩展 的 相关 知识 。 


二 >” 重点 导读 


。 理 解 测试 驱动 编程 。 

。 掌 握 单元 测试 。 
熟悉 常用 的 测试 工具 。 

。 掌 握 源 代码 检查 工具 。 

* 理解 程序 打包 。 

。 掌 握 常用 程序 打包 工具 。 

“掌握 Python 与 其 他 语言 的 扩展 过 程 。 


16.1 “Python 测试 


在 软件 工程 中 ， 我 们 知道 黑 盒 测试 与 白 盒 测试 ， 可 见 测试 是 编程 中 十 分 重要 的 一 部 分 。Python 是 一 门 
简洁 、 优 雅 的 语言 ， 同 时 第 三 方 库 众 多 ， 对 测试 人 员 来 说 是 最 合适 的 语言 。 通 过 测试 ， 可 确定 代码 面 对 各 
种 输入 都 能 够 按 要 求 的 那样 工作 。 在 程序 中 添加 新 代码 时 ， 也 可 以 对 其 进行 测试 ， 确 认 它 们 不 会 破坏 程序 
既 有 的 行为 。Python 提供 了 一 种 自动 测试 函数 输出 的 高 效 方式 。 


6.1.1 测试 的 主要 步骤 


(1) 编写 测试 用 例 : 按照 测试 计划 以 及 对 产品 特性 的 把 握 、 确 认 测 试 的 范围 ， 考 虑 逻辑 、 数 据 完 整 性 
等 要 求 ， 详 细 规 定 测试 的 要 求 ， 策 划 、 编 写 测 试用 例 。 做 好 测试 前 的 准备 工作 ， 确 保 测试 目的 的 达成 。 可 
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以 使 用 Python 自 带 的 单元 测试 框架 来 编写 自动 化 测试 用 例 ， 利 用 其 组 织 测试 用 例 ， 断 言 预 期 结果 ， 以 及 批 
量 执 行 测试 用 例 等 功能 ， 可 以 很 好 地 进行 自动 化 测试 的 开发 。 

(2) 执行 测试 用 例 ， 根 据 测试 计划 及 测试 案例 ， 执 行 测试 ， 并 根据 产品 特点 及 测试 要 求 ， 实 施 集成 测 
试 、 系 统 测试 等 ， 及 时 发 现 软件 缺陷 ， 评 估 软 件 的 特性 与 缺陷 ， 确 保 测 试 目的 的 达成 。 

(3) 反复 调试 程序 ， 执行 测试 时 能 够 发 现 程序 中 的 Bug， 此 时 需要 结合 需求 分 析 ， 不 断 调整 程序 中 的 
缺陷 ， 增 加 或 修改 程序 的 部 分 功能 。 

(4) 提交 测试 报告 ， 通 过 不 断 测试 ，Bug 跟踪 修复 ， 直 到 用 例 全 部 测试 ， 覆 盖 率 、 缺 陷 率 以 及 其 他 各 
项 指标 达到 质量 标准 ， 符 合 需求 分 析 的 要 求 ， 测 试 才 结束 。 


16.1.2 ”测试 驱动 开发 - 


回 

我 们 或 许 听 说 过 “ 先 测 试 ， 再 编码 ” 先 写 一 点 儿 测 试 ， 再 写 一 点 儿 代码 ， 这 就 是 测试 方法 中 的 一 个 重 
要 思想 ， 也 叫 “ 驱 动 编程 测试 ”。 测 试 驱动 开发 ， 是 一 种 不 同 于 传统 软件 开发 流程 的 新 型 的 开发 方法 。 它 要 
求 在 编写 某 个 功能 的 代码 之 前 先 编写 测试 代码 ， 然 后 只 编写 使 测试 通过 的 功能 代码 ， 通 过 测试 来 推动 整个 
开发 的 进行 。 这 有 助 于 编写 简洁 可 用 和 高 质量 的 代码 ， 并 加 速 开 发 过 程 。 

测试 驱动 开发 的 基本 过 程 如 下 。 

(1) 快速 新 增 一 个 测试 。 

(2) 运行 所 有 的 测试 《有 时 候 只 需要 运行 一 个 或 一 部 分 )， 发 现 新 增 的 测试 不 能 通过 。 

(3) 做 一 些小 小 的 改动 ， 尽 快 地 让 测试 程序 可 运行 ， 为 此 可 以 在 程序 中 使 用 一 些 不 合 情 理 的 方法 。 

(4) 运行 所 有 的 测试 ， 并 且 全 部 通过 。 

(5) 重 构 代 码 ， 以 消除 重复 设计 ， 优 化 设计 结构 。 

测试 驱动 开发 也 遵循 几 个 原则 : 让 测试 尽 可 能 快 地 运行 ， 尽 量 在 小 范围 内 进行 ， 测 试 之 间 互 不 干扰 ， 
所 有 的 测试 都 是 不 依赖 于 顺序 的 。 遵 循 以 上 测试 要 求 ， 这 对 程序 开发 人 员 是 有 利 的 。 每 个 测试 会 变 得 更 加 
简单 而 且 可 以 快速 运行 ， 对 象 也 会 变 成 漂亮 的 “高 内 聚 、 低 耦合 ”的 类 对 象 。 这 种 以 测试 为 驱动 的 开发 模 
式 最 大 的 好 处 就 是 确保 一 个 程序 模块 的 行为 符合 我 们 设计 的 测试 用 例 。 在 将 来 修改 的 时 候 ， 可 以 极 大 程度 
地 保证 该 模块 行为 仍然 是 正确 的 。 


16.1.3 ”单元 测试 


单元 测试 是 用 来 对 一 个 模块 、 一 个 函数 或 者 一 个 类 来 进行 正确 性 检验 的 测试 工作 。 单 元 测试 期 间 着 重 
从 以 下 几 个 方面 对 模块 进行 测试 ， 模 块 接口 、 局 部 数据 结构 、 重 要 的 执行 通路 、 出 错 处 理 通路 及 边界 条 件 
等 。 如 果 单元 测试 通过 ， 说 明 测 试 的 这 个 函数 能 够 正常 工作 。 如 果 单元 测试 不 通过 ， 要 么 函数 有 Bug， 要 
么 测试 条 件 输入 不 正确 ， 总 之 ， 需 要 修复 使 单元 测试 能 够 通过 。 

例如 定义 了 一 个 函数 F(x)=a*b: 

(1) 当 输 入 a=2，b=3 时 ， 期 望 得 到 的 是 6。 

(2) 当 输 入 a=“c”，b=3 时 ， 期 望 得 到 的 是 “ccc”。 

(3) 当 输 入 异常 数据 时 ， 期 望 测试 程序 能 抛 出 异常 。 

把 上 面 的 测试 用 例 放 到 一 个 测试 模块 里 ， 就 是 一 个 完整 的 单元 测试 。 

单元 测试 通过 后 有 什么 意义 呢 ? 如 果 对 原 函 数 代码 做 了 修改 ， 只 需要 再 做 一 遍 单元 测试 ， 如 果 通 过 ， 
说 明 我 们 的 修改 不 会 对 原 函 数 原 有 的 行为 造成 影响 ,如 果 测 试 不 通过 , 说 明 我 们 的 修改 与 原 有 行为 不 一 致 ， 
要 么 修改 代码 ， 要 么 修改 测试 。 因 此 可 以 说 ， 单 元 测试 可 以 有 效 地 测试 某 个 程序 模块 的 行为 ， 是 未 来 重 构 
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代码 的 信心 保证 。 但 是 单元 测试 通过 了 并 不 意味 着 程序 就 没有 Bug 了 ， 但 是 不 通过 程序 肯定 有 Bug。 


16.1.4 ”常用 的 测试 工具 


编写 大 量 测试 代码 来 保证 程序 中 的 每 个 细节 都 能 正常 工作 ， 是 一 项 很 烦琐 的 工程 。 但 是 在 标准 库 中 ， 
有 很 多 模块 可 以 帮助 我 们 进行 测试 。 本 章 着 重 介绍 两 个 优秀 的 模块 ， 可 以 协助 开发 人 员 自动 完成 测试 过 程 。 

1. doctest 

它 是 一 个 Python 标准 库 自 带 的 轻 量 单元 测试 工具 ， 适 合 实现 一 些 简单 的 单元 测试 。 它 可 以 在 docstring 
中 寻找 测试 用 例 并 执行 ， 比 较 输 出 结果 与 期 望 值 是 否 符合 。 

基本 用 法 : 使 用 doctest 需要 先 在 Python 的 交互 解释 器 中 创建 测试 用 例 ， 并 复制 粘贴 到 docstring 中 即 可 。 

【 例 16-1】 代 码 如 下 。 


def test_function(a，b) : 
Feturn a * b 


在 这 里 定义 一 个 函数 test_function0 实 现 两 个 值 相 乘 ， 使 用 如 下 命令 执行 测试 。 
$ python -m doctest Chap13.1.pPY-V 
Trying: 
test_function(3, 3) 
Expecting: 
3 


ok 
Trying: 
my_function('1', 3) 
Expecting: 
叫 区 
OK 
1 items had no tests: 
1 
1 items passed all tests: 
2 tests in a.my_function 
2 tests in 2 items. 
2 passed and 0 failed. 
Test passed 


doctest 在 docstring 中 寻找 测试 用 例 的 时 候 ， 认 为 >>> 是 一 个 测试 用 例 的 开始 ， 直 到 遇 到 空 行 或 者 下 一 
个 >>>， 如 果 在 两 个 测试 用 例 之 间 有 其 他 内 容 的 话 ， 会 被 doctest 忽略 (可 以 利用 这 个 特性 为 测试 用 例 编写 
一 些 注释 )。 如 果 文 档 字符 串 中 的 例子 通过 ， 那 么 doctest 测试 通过 。 如 果 验 证 到 文档 字符 串 中 有 例子 不 通 
过 ， 那 么 doctest 测试 框架 会 明显 地 提示 失败 的 原因 和 位 置 。 

2. unitest 

unitest 是 基于 Java 的 测试 框架 Jnit， 它 比 doctest 测试 框架 更 灵活 和 强大 。unitest 中 最 核心 的 四 个 部 分 
是 : TestFixture、TestCase、TestSuite、TestRunner。unitest 通用 的 测试 框架 ， 功 能 比较 齐全 ， 能 够 用 来 做 真 
正 的 单元 测试 。 

TestFixture: 简单 来 说 就 是 做 一 些 测试 过 程 中 需要 准备 的 东西 , 例如 创建 临时 的 数据 库 、 文 件 和 目录 等 ， 
其 中 ，setUp0 和 setDown0 是 最 常用 的 方法 。 

TestCase: 用 户 自 定义 的 测试 case 的 基 类 , 调用 run0 方 法 , 会 依次 调用 setUP0 方 法 、 执行 用 例 的 方法 、 
tearDown() 方 法 。 

TestSuite: 测试 用 例 集合 ， 可 以 通过 addTest0 方 法 手动 增加 TestCase， 也 可 通过 TestLoader 自动 添加 
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TestCase，TestLoader 在 添加 用 例 时 ， 会 没有 顺序 。 

TestRunner: 运行 测试 用 例 的 驱动 类 , 可 以 执行 TestCase, 也 可 执行 TestSuite。 执 行 后 TestCase 和 TestSuite 
会 自动 管理 TestResult。 

TestCase 的 实例 就 是 一 个 测试 用 例 。 测 试用 例 就 是 指 一 个 完整 的 测试 流程 ， 包 括 测试 前 准备 环境 的 搭 
建 ， 执 行 测试 代码 ， 以 及 测试 后 环境 的 还 原 。 单 元 测试 的 本 质 也 就 在 这 里 ， 一 个 测试 用 例 是 一 个 完整 的 测 
试 单元 , 通过 运行 这 个 测试 单元 , 可 以 对 某 一 个 问题 进行 验证 。 而 多 个 测试 用 例 集合 在 一 起 , 就 是 TestSuite， 
而 且 TestSuite 也 可 以 嵌 套 TestSuite。TestLoader 是 用 来 加 载 TestCase 到 TestSuite 中 的 。TextTestRunner 是 
用 来 执行 测试 用 例 的 ， 其 中 的 run(test) 会 执行 TestSuite/TestCase 中 的 run 方法 ， 测 试 的 结果 会 保存 到 
TextTestResult 实例 中 ， 包 括 运行 了 多 少 测试 用 例 ， 成 功 了 多 少 ， 失 败 了 多 少 等 信息 。 综 上 ， 整 个 流程 就 是 
首先 要 写 好 TestCase, 然后 由 TestLoader 加 载 TestCase 到 TestSuite, 然后 由 TextTestRunner 来 运行 TestSuite， 
运行 的 结果 保存 在 TextTestResult 中 ， 整 个 过 程 集成 在 unittestmain 模块 中 。 

【 例 16-2】 测 试 一 个 简单 的 加 减 乘除 接口 。 


def add(a，b) : 
Feturn a + b 
def minus (a，b) : 
Teturn a - b 
def multi(a，b) : 
returna*b 
def divide(a，b) : 
Feturn a / b 
代码 如 下 。 
import unittest 
from mathfunc import * 
class TestMathFunc (unittest.TestCase): 
def test add(self): 
self.assertEqual (3, add(1, 2)) 
self.assertNotEqual (3, add(2, 2)) 
def test minus(self): 
self.assertEqual (1, minus(3, 2)) 
def test multi (self): 
self.assertEqual (6, multi(3, 2)) 
def test divide(self): 
self.assertEqual (2, divide(6, 3)) 
self.assertEqual (2.5, divide(5, 2)) 
if name ==' main _': 
unittest.main () 


输出 的 结果 如 图 16-1 所 示 。 

可 以 看 到 一 共 运 行 了 4 个 测试 ， 失 败 了 1 个 ， 并 且 给 出 了 失败 原因 ，2.5!:=2， 也 就 是 说 我 们 的 divide 
方法 是 有 问题 的 。 在 第 一 行 给 出 了 每 一 个 用 例 执行 的 结果 的 标识 , 成 功 是 ., 失败 是 F, 出 错 是 E, 跳 过 是 S。 
从 上 面 可 以 看 出 ， 测 试 的 执行 跟 方法 的 顺序 没有 关系 ，divide 方法 写 在 了 第 4 个 ， 但 是 却 在 第 2 个 执行 。 
每 个 测试 方法 均 以 test 开头 , 否则 不 能 被 unittest 识别 。 在 uniitestmain0 中 加 verbosity 参数 可 以 控制 输出 的 

洪 误 报告 的 详细 程度 ， 默 认 是 1， 如 果 设 为 0， 则 不 输出 每 一 用 例 的 执行 结果 ， 即 没有 上 面 的 结果 中 的 第 1 
行 ， 如 果 设 为 2， 则 输出 详细 的 执行 结果 ， 如 图 16-2 所 示 。 
unittest 的 流程 ， 写 好 TestCase， 然 后 由 TestLoader 加 载 TestCase 到 TestSuite， 然 后 由 TextTestRunner 
来 运行 TestSuite， 运 行 的 结果 保存 在 TextTestResult 中 ， 我 们 通过 命令 行 或 者 unittestmain0 执 行 时 ，main 
会 调用 TextTestRunner 中 的 run 来 执行 ， 或 者 可 以 直接 通过 TextTestRunner 来 执行 用 例 。 
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一 -一 


16-1 ”加 减 乘除 接口 图 16-2 ”加 减 乘 除 接口 


一 个 class 继承 unittest.TestCase 即 是 一 个 TestCase， 其 中 以 test 开头 的 方法 在 load 时 被 加 载 为 一 个 真 
正 的 TestCase。verbosity 参数 可 以 控制 执行 结果 的 输出 ，0 是 简单 报告 、1 是 一 般 报 告 、2 是 详细 报告 。 可 
以 通过 addTest 和 addTests 向 suite 中 添加 case 或 suite， 可 以 用 TestLoader 的 loadTestsFrom (0 方法 。 用 
setUpO、tearDownO、setUpClass0 以 及 tearDownClass0 可 以 在 用 例 执 行 前 布置 环境 ， 以 及 在 用 例 执行 后 清 
理 环境 。 可 以 通过 skip、skipIf、skipUnless 装饰 器 跳 过 某 个 case， 或 者 用 TestCase.skipTest 方法 。 


常用 的 一 些 TestCase 方法 如 下 。 

assertEqual(a,b[,msg]) 核 实 a=b， 若 不 同 则 失败 ， 在 回溯 中 打印 两 个 值 。 
assertNotEqual(a,b[,msg]) 同 assertEqual 相反 。 

assertTrue(a) 核 实 x 为 True。 
assertFalse(a) 核 实 x 为 False。 
assertIn(item,list) 核 实 item 在 list 中。 
assertNotIn(item,list) 核 实 item 不 在 list 中 。 
assert_(expr[,msg]) 如 果 表达 式 为 假 则 失败 ， 可 选 自给 出 信息 。 
failIf(expr[,msg]) 同 assert_ 相反。 


16.1.5 “Python 常见 代码 检查 工具 


源 代 码 检查 是 一 种 寻找 代码 中 普遍 错误 或 问题 的 方法 。PyChecker 和 Pylint 是 两 个 可 以 检查 Python 源 
代码 的 工具 。 它 们 都 需要 单独 安装 ， 且 有 两 种 方式 来 使 用 它们 ， 一 种 是 将 它们 作为 命令 行 工具 来 使 用 ， 一 
种 是 将 它们 嵌入 到 代码 中 进行 检查 。 

1. Pyflakes 

一 个 用 于 检查 Python 源 文件 错误 的 简单 程序 。Pyflakes 分 析 程 序 并 且 检查 各 种 错误 。 它 通过 解析 源 文 
件 实现 ， 无 须 导 入 它 ， 因 此 在 模块 中 使 用 是 安全 的 ， 没 有 任何 的 副作用 。 

Pyflakes 不 会 检查 代码 风格 。 由 于 它 是 单独 检查 各 个 文件 ,因此 它 也 相当 的 快 ， 当 然 检测 范围 也 有 一 定 
的 局 限 。 

2. Pylint 

Pylint 是 一 个 Python 代码 分 析 工 具 ， 它 分 析 Python 代码 中 的 错误 ， 查 找 不 符合 代码 风格 标准 和 有 潜在 
问题 的 代码 。Pylint 是 一 个 Python 工具 ， 除 了 平常 代码 分 析 工 具 的 作用 之 外 ， 它 提供 了 更 多 的 功能 ， 如 检 
查 一 行 代码 的 长 度 ， 变 量 名 是 否 符合 命名 标准 ,一 个 声明 过 的 接口 是 否 被 真正 实现 等 。Pylint 的 一 个 很 大 的 
好 处 是 它 的 高 可 配置 性 ， 高 可 定制 性 ， 并 且 可 以 很 容易 编写 小 插件 来 添加 功能 。 如 果 运 行 两 次 Pylint， 它 会 
同时 显示 出 当前 和 上 次 的 运行 结果 ， 从 而 可 以 看 出 代码 质量 是 否 得 到 了 改进 。 
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3. PyChecker 

PyChecker 是 Python 代码 的 静态 分 析 工 具 ， 它 能 够 帮助 查找 Python 代码 中 的 Bug， 而 且 能 够 对 代码 的 
复杂 度 和 难度 提供 警告 。PyChecker 可 以 工作 在 多 种 方式 之 下 。 首 先 ，PyChecker 会 检查 导入 文件 中 包含 的 
模块 ， 检 查 导 入 是 否 正确 ， 同 时 检查 函数 中 的 类 和 方法 是 否 正确 。 

(1) 全 局 量 没 有 找到 ， 例 如 没有 导入 模块 。 

(2) 传递 给 函数 、 方 法 、 构 造 器 的 参数 数目 错误 。 

(3) 传递 给 内 建 函 数 和 方法 的 参数 数目 错误 。 

(4) 字符 串 格式 化 信息 不 匹配 。 

(5) 使 用 不 存在 的 类 方法 和 属性 。 

(6) 覆盖 函数 时 改变 了 签名 。 

(7) 在 同一 作用 域 中 重 定义 了 函数 、 类 、 方 法 。 

(8) 使 用 未 初始 化 的 变量 。 

(9) 方法 的 第 一 个 参数 不 是 self。 

(10) 未 使 用 的 全 局 量 和 本 地 量 (模块 或 变量 )。 

(11) 未 使 用 的 函数 /方法 的 参数 。 

(12) 模块 、 类 、 函 数 和 方法 中 没有 docstring。 


16.1.6 ”Python 程序 性 能 检测 工具 


对 代码 优化 的 前 提 是 需要 了 解 性 能 瓶颈 在 什么 地 方 ， 程 序 运行 的 主要 时 间 是 消耗 在 哪里 ， 对 于 比较 复 
杂 的 代码 可 以 借助 一 些 工具 来 定位 。Python 标准 库 中 有 一 个 叫 作 profile 的 分 析 模 块 ， 可 以 检查 Python 程序 
的 执行 性 能 。 测 试 的 方法 大 致 如 下 : 利用 profile 对 每 个 Python 模块 进行 测试 (具体 显示 可 以 采用 文本 报表 
或 者 图 形 化 显示 )， 找 到 热点 性 能 瓶颈 函数 之 后 ， 再 利用 line_profiler 进行 逐 行 测试 ， 寻 找 具 有 高 Hits 值 或 
高 Time 值 的 行 ， 最 后 把 需要 优化 的 行 语句 通过 优化 工具 进行 优化 。 
profile 的 分 析 模 块 分 析 程 序 十 分 简单 ， 只 要 使 用 字符 串 参 数 调用 它 的 运行 方法 即 可 。 
【 例 16-3】 字 符 串 参 数 调用 ， 如 图 16-3 所 示 。 


Python 中 还 提供 了 timeit 模块 来 测量 代码 的 执行 速度 ， 可 以 用 该 模块 来 对 各 种 简单 的 语句 进行 计时 。 
【 例 16-4】 调 用 timeit， 如 图 16-4 所 示 。 


图 16-3 字符 串 参数 调用 图 16-4 timeit 参数 调用 
timeit 只 输出 被 测试 代码 的 总 运行 时 间 ， 单 位 为 秒 ， 没 有 详细 的 统计 。 


1 


16.2 程序 打包 


了 Python 是 一 个 脚本 语言 ， 被 解释 器 解释 执行 。 它 的 发 布 方式 如 下 。 
.py 文件 ， 对 于 开源 项 目 或 者 源码 没 那么 重要 的 ， 直 接 提 供 源码 ， 需 要 使 用 者 自行 安装 Python 并 且 安 
装 依赖 的 各 种 库 。(Python 官方 的 各 种 安装 包 就 是 这 样 做 的 。) 
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.pyc 文件 ， 有 些 公司 或 个 人 因为 机 密 或 者 各 种 原因 ， 不 愿意 源码 被 运行 者 看 到 ， 可 以 使 用 pyc 文件 发 
布 ，pye 文件 是 Python 解释 器 可 以 识别 的 二 进 制 码 ， 故 发 布 后 也 是 跨 平台 的 ， 需 要 使 用 者 安装 相应 版 本 的 


Python 和 依赖 库 。 
可 执行 文件 ， 对 于 非 程 序 开发 人 员 ， 


最 简单 的 方式 就 是 提供 一 个 可 执行 文件 ， 只 需要 把 用 法 告诉 他 即 


可 。 比 较 麻烦 的 是 需要 针对 不 同 平台 打包 不 同 的 可 执行 文件 。 
在 Python 中 , 程序 员 会 用 到 一 些 稍微 底层 的 接口 。 用 于 发 布 Python 包 的 工具 包 Distutils 能 让 程序 员 轻 
松 地 用 Python 编写 安装 脚本 。 这 些 脚 本 可 以 用 来 建立 发 布 的 存档 文件 ， 程 序 员 就 可 以 编译 和 安装 开发 者 所 


编写 的 程序 库 了 。 
党 16.2.1 Distutils 的 使 用 


eb 


Distutils 是 Python 自 带 的 基本 安装 工具 ， 可 以 用 来 在 Python 环境 中 构建 和 安装 额外 的 模块 。 新 的 模块 
可 以 是 纯 Python 的 ， 也 可 以 是 C/C++ 的 扩展 模块 ， 或 者 是 Python 包 ( 包 中 包含 C 与 Python 编写 的 模块 )。 
适用 于 非常 简单 的 应 用 场景 使 用 ， 不 支持 依赖 包 的 安装 。 通 过 Distutils 来 打包 ， 生 成 安装 包 ， 安 装 Python 
包 等 工作 ， 需 要 编写 名 为 “setup.py” 的 Python 脚本 文件 。 用 Distutils 打包 过 程 如 下 。 

新 建文 件 夹 ， 将 项 目 文件 放 进 去 ， 在 该 文件 夹 下 ， 新 建 setup.py 文件 ， 执 行 python setup.py sdist 即 可 


打包 。 代 码 如 下 : 
from distutils.core import setup 
setup( 
name = "dennings", 
version = "1.0.0", 
author = "shijian", 


packages=['denning', 'templates'], 
Py _modules=[' init ','config', 'manage', 'settings', ‘urls','wsgi'], 
data files=[('ini', ['django wsgi.ini']),('readme', ['readme.txt'])] 


) 
保存 退出 。 


在 命令 行 下 ， 进 入 该 文件 夹 ， 运 行 以 下 命令 。 


(1) 打包 : python setup.py sdist。 
这 样 在 文件 夹 中 就 多 出 了 几 个 文件 ， 
(2) 安装 包 到 本 地 副本 中 〈 路 径 为 : 


在 dist 文件 夹 中 的 logIn-1.0.0.tar.gz 就 是 我 们 的 发 布 包 了 。 
/usr/local/lib/python2.7/dist-packages )。 


sudo python setup.py install(—record files.txt) 
注意 : 为 了 方便 印 载 ， 可 以 添加 括号 中 的 选项 ( 当前 文件 夹 会 产生 files.txt )， 印 载 时 就 可 以 在 当前 文件 


夹 下 使 用 如 下 命令 : 


sudo cat files.txt | sudo xargs rm -rf 


16.2.2 Setuptools 的 使 用 
Setuptools 针对 Distutils 做 了 大 量 扩 


展 ， 尤 其 是 加 入 了 包 依 赖 机 制 。Distutils 无 法 定义 包 之 间 的 依赖 关 


系 。Setuptools 则 是 它 的 增强 版 ， 能 帮助 用 户 更 好 地 创建 和 分 发 Python 包 ， 尤 其 是 具有 复杂 依赖 关系 的 包 。 
其 通过 添加 一 个 基本 的 依赖 系统 以 及 许多 相关 功能 ， 弥 补 了 该 缺陷 。 它 还 提供 了 自动 包 查询 程序 ， 用 来 自 


动 获取 包 之 间 的 依赖 关系 , 并 完成 这 些 包 


的 安装 , 大 大 降低 了 安装 各 种 包 的 难度 , 使 之 更 加 方便 ,一 般 Python 


安装 会 自 带 Setuptools， 如 果 没 有 可 以 使 用 pip 安装 : 
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$ pip install setuptools 

Setuptools 简单 易 用 ， 只 需 写 一 个 简短 的 setup.py 安装 文件 , 就 可 以 将 Python 应 用 打包 。 假设 有 一 个 自 
己 制作 的 Python 包 ， 叫 作 test( 内 含 _init .py 文件 )， 然 后 可 以 创建 一 个 setup.py 文件 ， 最 好 放 在 test 的 
同 级 目录 下 。 

【 例 16-5】Setuptools 的 使 用 。 

from setuptools import setup 


setup( 
name="test", 


version="1.0.0", 
description="My test module"， 
author="Xavier", 
url="http://www.csdn.net", 
packages= ['test'], 
) 
然后 ， 就 可 以 用 Python 的 setuptools 来 进行 打包 或 者 安装 了 。 之 后 执行 python setup.py bdist_egg 就 可 以 
打包 了 ， 出 现 的 是 以 .egg 为 扩展 名 的 zip 文件 。 执 行 python setup.py install 可 以 直接 安装 包 ， 而 包 将 会 被 安装 
在 /usr/local/lib/python2.7/dist-package/ 下 。 经 过 这 一 步 之 后 ， 打 开 任 何 项 目 就 都 可 以 直接 import test 了 。 
在 创建 Windows 安装 程序 或 pm 包 时 ,使 用 bdist 命令 可 以 创建 单一 的 Windows 安装 程序 和 Linux prm 
文件 。bdist 可 用 的 格式 有 rpm 和 wininst。 有 意思 的 是 ， 在 非 Windows 操作 系统 内 也 可 以 为 程序 包 建 立 
Windows 安装 程序 ， 前 提 是 没有 任何 需要 编译 的 扩展 。 


16.3 ”编程 扩展 


Python 是 一 门 强大 的 语言 ， 它 的 优势 是 易于 使 用 并 能 帮助 提高 开发 速度 ， 然 而 过 快 的 开发 速度 却 是 以 
相对 低 的 效率 为 代价 。 与 C 语言 相 比 ，Python 的 运行 速度 是 十 分 低 的 ， 还 存在 很 多 瓶颈 。 这 时 我 们 会 用 C 
语言 作为 扩展 来 重 写 出 现 瓶 颈 的 代码 来 解决 性 能 瓶颈 ， 创 建 C 语言 一 些 特有 的 东西 。 

一 般 来 说 ,所 有 能 被 整合 或 导入 到 其 他 Python 脚本 的 代码 ,都 可 以 被 称 为 扩展 。 可 以 用 纯 Python 来 写 
扩展 ， 也 可 以 用 C 和 C++ 之 类 的 编译 型 的 语言 来 写 扩展 〈 或 者 也 可 以 用 Java 给 Jython 写 扩展 )。Python 的 
一 大 特点 就 是 ， 扩 展 和 解释 器 之 间 的 交互 方式 与 普通 的 Python 模块 完全 一 样 。 


16.3.1 用 C 语言 扩展 过 程 


Python 的 扩展 通常 是 指 CPython, 它 是 C 语言 版 本 的 Python。 用 C 语言 扩展 编程 大 致 有 如 下 三 个 过 程 ， 
创建 应 用 代码 ， 也 就 是 编写 对 应 的 C\C++ 程 序 ， 根 据 模板 编写 封装 代码 ， 也 就 是 将 编写 的 C\C++ 程 序 ， 封 
装 成 接收 Python 数据 类 型 的 数据 ， 然 后 转换 为 C\C++ 数 据 类 型 数据 ， 然 后 执行 C\C++ 程 序 ， 将 返回 结构 转 
换 为 Python 数据 类 型 的 封装 函数 , 用 于 Python 调用 的 接口 ; 最 后 编译 \ 测 试 , 创建 setup, 将 模块 导入 Python 
环境 下 ， 测 试 程序 的 正确 性 。 

有 很 多 工具 帮助 我 们 实现 用 C 语言 进行 扩展 ， 例 如 Psyco、Pyrex、ctypes、SWIG 等 。 这 里 简单 介绍 一 
下 ctypes 方法 ， 这 个 模块 可 以 加 载 dl (Windows) 或 者 so (Linux)， 并 且 执 行 其 中 的 函数 ， 另 外 ， 它 也 提 
供 了 一 些 数据 类 型 ， 这 些 类 型 与 C 语言 中 的 基本 数据 类 型 一 一 对 应 ， 甚 至 提供 了 指针 。 

【 例 16-6】 结 构 体 类 型 和 结构 体 数 组 类 型 的 传递 ， 我 们 用 ctypes 的 方法 ， 在 Python 代码 中 生成 一 个 如 
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NS 


C 中 的 结构 体 。 
#define TaskTest struct Tasktest 
struct Tasktest 
{ 


int s; 
int c[20]; 
int m[20]; 
int T; 

} 


declspec (dllexport) float CalList (TaskTest * iTsets,int len) 
(1) Ctypes 方法 处 理 后 的 Python 代码 : 
from ctypes import * 
import time 
class Crandstruct (structure): 
_fields =[('si',c int), 
ci crine *20)% 
(mi', c_int * 20), 
Vie 
] 
(2) 生成 结构 体 数 组 : 
Strctset=(Crandstruct * len) () 


(3) 引入 C 代码 源码 中 的 dl 文件 : 


dllpath="C:\\dllgenerate\\Debug\\dllgenerate.d11" 
libc=cdl]l .LoadLibrary (dllpath) 
libc.CalList.restype=c_float 


(4) 调用 功能 函数 结 
U=libc.CalList (byref (strctset),1en) 


另外 还 有 很 多 有 用 的 工具 ， 读 者 可 以 查阅 资料 学 习 。 
16.3.2 ”Jython 与 Java 扩展 


Jython 是 一 种 可 以 把 两 种 不 同 的 编程 语言 结合 在 一 起 的 工具 。 它 能 在 Java 中 加 入 脚本 语言 ， 并 以 此 来 
简化 数 以 百 万 计 的 Java 程序 员 的 工作 。Jython 是 一 种 完整 的 语言 ， 而 不 是 一 个 Java 翻译 器 或 仅仅 是 一 个 
Python 编译 器 。Jython 提供 了 Python 的 大 部 分 功能 ， 以 及 实例 化 Java 类 并 与 Java 类 交互 的 功能 。Jython 
代码 被 动态 地 编译 成 Java 字 节 码 , 因此 ,可 以 用 Jython 扩展 Java 类 ,也 可 以 用 Java 来 扩展 Python, 使 Python 
成 为 一 个 易 用 的 脚本 部 件 ,Jython 也 有 很 多 从 Python 中 继承 的 模块 库 。 最 有 趣 的 事情 是 Jython 不 像 CPython 
或 其 他 任何 高 级 语言 ， 它 提供 了 对 其 实现 语言 的 一 切 存 取 。 所 以 Jython 不 仅 提供 了 Python 的 库 ， 同 时 也 提 
供 了 所 有 的 Java 类 ， 这 使 其 有 一 个 巨大 的 资源 库 。 

【 例 16-7】Jython 与 Java 扩展 。 


import org.pYthon.util.PythonInterpreter7 
import org.python.core.*;» 


public class JythonTest { public static void main(String[] args) { 
PythonIinterpreter interp = 
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new PythonIinterpreter () 7 
System.out .println ("Hello, brave new world") 7 
interp.exec ("import sys"); 
interp.exec ("print sys"); 
interp.set ("a", new PyInteger (42)); 
interp.exec ("print a")7 
interp.exec ("x = 2+2") 7 
PyObject x = interp.get ("x"); 
System.out .println ("x: "+x); 
System.out .println ("Goodbye, cruel world!"); 

} 

} 

执行 文件 即 可 。 

import org.python.util.PythonIinterpreter; 

import org.python.core.*; 

public class JythonTest { public static void main(string[] args) { 

PythonInterpreter interp = new PythonIinterpreter(); 
interp.execfile ("youwant .py"); 
} 
1, 
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Jython 要 求 程序 员 也 要 学 习 Java 开发 ， 语 法 仅 是 编程 的 一 方面 。 前 面 所 提 的 库 交叉 只 是 Jython 依赖 于 
Java 系统 的 一 个 例子 。 为 了 能 用 Jython 完成 实际 工作 ， 不 仅 需要 学 习 Java 库 ， 还 必须 掌握 通常 的 Java 编 


程 环境 。 


16.3.3 ”编译 扩展 


学 习 Python 编写 扩展 后 ， 还 需要 学 习 编译 扩展 。 使 用 Distutils 可 以 自动 编译 C 扩 


动 定位 Python 安装 并 指定 选用 的 编译 器 。 它 甚至 还 能 自动 运行 SWIG。 


16.4 ”就 业 面试 技巧 与 解析 
16.4.1 面试 技巧 与 解析 (一 ) 


展 ， 利 用 Distutils 自 


面试 官 : Python 到 底 是 什么 样 的 语言 ? 你 可 以 比较 其 他 技术 或 者 语言 来 回答 你 的 问题 。 
应 聘 者 : Python 是 解释 型 语言 。 这 意味 着 不 像 C 和 其 他 语言 ，Python 运行 前 不 需要 编译 。 其 他 解释 型 
语言 包括 PHP 和 Ruby。Python 是 动态 类 型 的 ， 这 意味 着 你 不 需要 在 声明 变量 时 指定 类 型 。Python 是 面向 


对 象 语言 ， 所 以 允许 定义 类 并 且 可 以 继承 和 组 合 。Python 没有 访问 标识 ， 如 在 C++ 


了 Python 中 ， 函 数 是 一 等 公民 。 这 就 意味 着 它们 可 以 被 赋值 ， 从 其 他 函数 返 


器 


值 ， 间 


ph 的 public、private， 在 
f 且 传递 函数 对 象 。 类 不 是 一 


等 公民 。 写 Python 代码 很 快 ， 但 是 跑 起 来 会 比 编译 型 语言 慢 。Python 允许 使 用 C 扩展 程序 ， 所 以 瓶颈 可 以 得 到 
处 理 。Numpy 库 就 是 一 个 很 好 的 例子 ， 因 为 很 多 代码 不 是 Python 直接 写 的 ， 所 以 运行 很 快 。Python 使 用 场景 
很 多 ，Web 应 用 开发 、 自 动 化 、 科 学 建 模 、 大 数据 应 用 等 。 它 也 经 常 被 看 作 “ 胶 水 ”语言 ， 使 得 不 同 语言 间 可 
以 衔接 上 。Python 能 够 简化 工作 ， 使 得 程序 员 能 够 关心 如 何 重 写 代码 而 不 是 详细 看 一 遍 底层 实现 。 
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16.4.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : 单元 测试 是 什么 ? 单元 测试 有 什么 好 处 ? 

应 聘 者 : 单元 测试 是 开发 者 编写 的 一 小 段 代码 ， 用 于 检验 被 测 代码 的 一 个 很 小 的 、 很 明确 的 功能 是 否 
正确 。 通 常 而 言 ， 一 个 单元 测试 是 用 于 判断 某 个 特定 条 件 〈 或 场景 ) 下 某 个 特定 函数 的 行为 。 单 元 测试 是 
用 来 对 一 个 模块 、 一 个 函数 或 者 一 个 类 来 进行 正确 性 检验 的 测试 工作 。 
单元 测试 从 长 期 来 看 ， 可 以 提高 代码 质量 ， 减 少 维护 成 本 ， 降 低 重 构 难度 。 通 过 单元 测试 我 们 能 快速 
熟悉 代码 ， 不 需要 深入 地 阅读 代码 ， 便 能 知道 这 段 代 码 做 什么 工作 ， 有 哪些 特殊 情况 需要 考虑 ， 包 含 哪些 
业务 。 
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第 17 章 
数据 结构 基础 


二 > 学 习 指引 


数据 结构 是 计算 机 存储 、 组 织 数 据 的 方式 。 数 据 结构 是 指 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 
素 的 集合 。 通 常情 况 下 ， 精 心 选择 的 数据 结构 可 以 带 来 更 高 的 运行 或 者 存储 效率 。 数 据 结构 往往 同 高 效 的 
检索 算法 和 索引 技术 有 关 ， 是 计算 机 程序 设计 的 重要 理论 技术 。 数 据 结构 算法 是 对 特定 问题 求解 步骤 的 一 
种 描述 ， 它 所 设计 的 每 一 条 指令 表示 程序 进行 的 一 个 或 多 个 操作 。 算 法 和 数据 结构 都 是 程序 设计 的 灵魂 ， 
一 般 在 大 型 项 目 或 者 复杂 的 任务 中 ， 就 需要 用 到 数据 结构 与 算法 的 巧妙 结合 来 解决 问题 。 


二 ”重点 导读 


。 了 解数 据 结构 中 的 线性 结构 。 
熟悉 Python 中 用 列表 创建 表 。 
。， 了 解数 据 结 构 中 的 树 状 结构 。 
。 热 悉 Python 中 用 列表 创建 树 。 
。 了 解数 据 结构 中 的 图 形 结构 。 
* 热 悉 Python 中 用 字典 构建 图 。 
* 热 悉 Python 中 查找 与 排序 方法 


17.1 概述 


一 个 数据 结构 是 由 数据 元 素 依据 某 种 逻辑 关系 组 织 起 来 的 。 对 数据 元 素 间 逻 辑 关系 的 描述 称 为 数据 的 
逻辑 结构 ， 数 据 必须 在 计算 机 内 存储 ， 数 据 的 存储 结构 是 数据 结构 的 实现 形式 ， 是 其 在 计算 机 内 的 表示 ; 
此 外 ， 讨 论 一 个 数据 结构 必须 同时 讨论 在 该 类 数据 上 执行 的 运算 才 有 意义 。 一 个 逻辑 数据 结构 可 以 有 多 种 
存储 结构 ， 且 各 种 存储 结构 影响 数据 处 理 的 效率 。 

在 许多 类 型 的 程序 设计 中 ， 数 据 结构 的 选择 是 一 个 基本 的 设计 考虑 因素 。 许 多 大 型 系统 的 构造 经 验 表 
明 ， 系 统 实现 的 困难 程度 和 系统 构造 的 质量 都 严重 依赖 于 是 否 选择 了 最 优 的 数据 结构 。 许 多 时 候 ， 确 定 了 
数据 结构 后 ， 算 法 就 容易 得 到 了 。 有 些 时 候 情况 也 会 反 过 来 ,我们 根据 特定 算法 来 选择 数据 结构 与 之 适应 。 
不 论 哪 种 情况 ， 选 择 合适 的 数据 结构 都 是 非常 重要 的 。 
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17.2 ”数据 结构 的 研究 对 象 


数据 结构 与 算法 的 主要 研究 内 容 有 : 数据 的 逻辑 结构 ， 即 数据 关系 之 间 的 逻辑 关系 ， 数据 的 存储 结构 ， 
即 数据 的 逻辑 结构 在 计算 机 中 的 表示 ; 操作 算法 ， 即 插入 、 删 除 、 修 改 、 查 询 、 排 序 等 。 


数据 的 逻辑 结构 


数据 的 逻辑 结构 指 反 映 数据 元 素 之 间 逻 辑 关 系 的 数据 结构 ， 其 中 的 逻辑 关系 是 指数 据 元 素 之 间 的 前 后 
件 关系 ， 而 与 它们 在 计算 机 中 的 存储 位 置 无 关 。 逻 辑 结构 包括 以 下 几 种 。 

(1) 集合 : 数据 结构 中 的 元 素 之 间 除了 “同属 一 个 集合 ”的 相互 关系 外 ， 别 无 其 他 关系 。 

(2) 线性 结构 : 数据 结构 中 的 元 素 存在 一 对 一 的 相互 关系 。 

(3) 树 状 结构 : 数据 结构 中 的 元 素 存在 一 对 多 的 相互 关系 。 

(4) 图 形 结构 : 数据 结构 中 的 元 素 存在 多 对 多 的 相互 关系 。 


7.2.2 数据 的 物理 结构 


数据 的 物理 结构 指数 据 的 逻辑 结构 在 计算 机 存储 空间 的 存放 形式 。 数 据 的 物理 结构 是 数据 结构 在 计算 
机 中 的 表示 〈 又 称 映像 )， 它 包括 数据 元 素 的 机 内 表示 和 关系 的 机 内 表示 。 由 于 具体 实现 的 方法 有 顺序 、 链 
接 、 索 引 、 散 列 等 多 种 ， 所 以 ， 一 种 数据 结构 可 表示 成 一 种 或 多 种 存储 结构 。 
数据 元 素 的 机 内 表示 映像 方法 )， 用 二 进 制 位 的 位 串 表示 数据 元 素 。 通 常 称 这 种 位 串 为 节点 。 当 数据 
元 素 由 若干 个 数据 项 组 成 时 ， 位 串 中 与 各 数据 项 对 应 的 子 位 串 称 为 数据 域 。 因 此 ， 节 点 是 数据 元 素 的 机 内 
表示 或 机 内 映像 )。 
关系 的 机 内 表示 (映像 方法 ): 数据 元 素 之 间 的 关系 的 机 内 表示 可 以 分 为 顺序 映像 和 非 顺序 映像 ， 常 用 
两 种 存储 结构 : 顺序 存储 结构 和 链 式 存储 结构 。 顺 序 映 像 借助 元 素 在 存储 器 中 的 相对 位 置 来 表示 数据 元 素 
之 间 的 逻辑 关系 。 非 顺序 映像 借助 指示 元 素 存储 位 置 的 指针 来 表示 数据 元 素 之 间 的 逻辑 关系 。 


17.3 “Python 数据 结构 之 线性 结构 


在 程序 设计 中 ， 要 将 一 组 数据 元 素 进行 整体 的 管理 和 使 用 ， 通 常 需要 创建 一 种 元 素 组 ， 用 变量 记录 数 
据 ， 传 进 传 出 函数 等 ， 同 时 可 以 增加 删除 元 素 。 将 这 样 一 组 元 素 看 成 一 个 序列 ， 用 元 素 在 序列 里 的 位 置 和 
顺序 ， 表 示 实 际 应 用 中 的 某 种 有 意义 的 信息 ， 或 者 表示 数据 之 间 的 某 种 关系 。 这 样 的 一 组 序列 元 素 的 组 织 
形式 ， 可 以 将 其 抽象 为 线性 表 。 线 性 结构 的 特点 是 元 素 之 间 构成 有 序 序列 ， 除 头 尾 元 素 外 ， 其 余 元 素 都 有 
一 个 前 驱 和 一 个 后 继 。 线 性 结构 中 ， 表 、 栈 和 队列 都 是 最 基本 的 。 


线性 表 的 抽象 数据 类 型 
list (self) # 创 建 一 个 新 表 
is_empty (self) # 判 断 self 是 否 是 一 个 空 表 
len(self) # 返 回 表 长 度 


prepend (self, elem) ## 在 表 头 插入 元 素 
append (self, elem) 痊 在 表 尾 加 入 元 素 
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insert (self,elem,i) ”# 在 表 的 位 置 处 插入 元 素 


del first (self) # 删 除 第 一 个 元 素 

def 1ast(self) # 删 除 最 后 一 个 元 素 

del (self, i) 4# 删 除 第 1 个 元 素 

search (self, elem) 专 查 找 元 素 在 表 中 第 一 次 出 现 的 位 置 
forall (self, op) 装 对 表 元 素 的 遍历 操作 ,op 操作 


17.3.2 Python 中 的 线性 表 


线性 表 是 最 基本 、 最 简单 ， 也 是 最 常用 的 一 种 数据 结构 。 线 性 表 是 数据 结构 的 一 种 ， 一 个 线性 表 是 7 
个 具有 相同 特性 的 数据 元 素 的 有 限 序列 。 线 性 表 中 数据 元 素 之 间 的 关系 是 一 对 一 的 关系 ， 即 除了 第 一 个 和 
最 后 一 个 数据 元 素 之 外 ， 其 他 数据 元 素 都 是 首尾 相 接 的 。 

(1) 顺序 表 : Python 中 的 list 和 tuple 两 种 类 型 采用 了 顺序 表 的 实现 技术 ， 具 有 前 面 讨论 的 顺序 表 的 所 
有 性 质 。tuple 是 不 可 变 类 型 ， 即 不 变 的 顺序 表 ， 因 此 不 支持 改变 其 内 部 状态 的 任何 操作 ， 而 其 他 方面 则 与 
list 的 性 质 类 似 。 

Python 标准 类 型 list 就 是 一 种 元 素 个 数 可 变 的 线性 表 ， 可 以 加 入 和 删除 元 素 ， 并 在 各 种 操作 中 维持 已 
有 元 素 的 顺序 〈 即 保 序 )。list 就 是 一 种 采用 分 离 式 技术 实现 的 动态 顺序 表 ， 因 此 可 以 直接 用 Python 中 的 列 
表 来 创建 表 。 其 主要 使 用 命令 如 下 。 


list1 = list([1,2,3,4,5]) # 创 建新 表 
listl.append (6) # 在 尾部 添加 新 元 素 6 
k = len(list1) # 返 回 表 长 度 
listl.insert (k,7) # 在 位 置 x 插 入 了 
1ist1.pop () # 返 回 并 删除 尾部 元 素 
print (list1) # 输 出 表 的 全 部 元 素 
list2 = 1ist1[2:] # 表 的 切片 操作 


顺序 表 的 结构 如 图 17-1 所 示 。 


17-1 顺序 表 


(2) 链表 : 将 元 素 存放 在 通过 链接 构造 起 来 的 一 系列 存储 块 中 。 链 表 结构 可 以 充分 利用 计算 机 内 存 空 
间 ， 实 现 灵 活 的 内 存 动 态 管理 。 它 不 像 顺 序 表 一 样 连续 存储 数据 ， 而 是 在 每 一 个 节点 (数据 存储 单元 ) 下 
存放 下 一 个 节点 的 位 置信 息 。 
单 向 链表 也 叫 单 链表 ， 是 链表 中 最 简单 的 一 种 形式 ， 它 的 每 个 节点 包含 两 个 域 ， 一 个 信息 域 ( 元 素 域 》 和 
一 个 链接 域 。 这 个 链接 域 指向 链表 中 的 下 一 个 节点 , 而 最 后 一 个 节点 的 链接 域 则 指向 一 个 空 值 , 如 图 17-2 所 示 。 
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图 17-2 单 链表 
单 链 表 的 一 个 变形 是 单 向 循环 链表 ， 链 表 中 最 后 一 个 节点 的 next 域 不 再 为 空 值 ， 而 是 指向 链表 的 头 节 


点 ， 如 图 17-3 所 示 。 
am | 十 | ae | 本 | as | -> | | 


图 17-3 单 向 循环 链表 


还 有 一 种 链表 是 双向 链表 。 每 个 节点 有 两 个 链接 : 一 个 指向 前 一 个 节点 ， 当 此 节点 为 第 一 个 节点 时 ， 
指向 空 值 ， 而 另 一 个 指向 下 一 个 节点 ， 当 此 节点 为 最 后 一 个 节点 时 ， 指 向 空 值 ， 如 图 17-4 所 示 。 


[mm [a [Te [a T |] 
图 17-4 ”双向 链表 
【 例 17-1】 构 建 单 向 循环 链表 。 
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pre = self. head ## 第 一 个 节点 不 是 要 删除 的 
while cur.next != self. head: 
if cur.item == item: # 找 到 了 要 删除 的 元 素 
pre.next = cur.next 
return 
else: 


pre = cur 
cur = cur.next 
if cur.item == item: 
pre.next = cur.next 
def search(self, item): 4# 查 找 节点 是 否 存在 
if self.is empty(): 
return False 
cur = self. head 
if cur.item == item: 
return True 
while cur.next ! 
cur = cur.next 


self. head: 


if cur.item == item: 
return True 
return False 


if name ==" main "; 
11 = SinCycLinkedlist () 
11.add(1) 
11.add(2) 
11.append (3) 


11.insert (2, 4) 
lL-insert(4 5S) 
1l.insert (0, 6) 

print ("length:",11.1length()) 
11.travel() 
print(11.search(3) ) 

print (11.search(7)) 
11.remove (1) 

print ("length:",11.1length()) 
11.travel () 


程序 运行 结果 如 图 17-5 所 


图 17-5 单 向 循环 链表 
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该 案例 代码 实现 了 单 向 循环 链表 的 操作 ， 从 定义 节点 开始 到 每 个 函数 模块 对 相应 的 功能 实现 了 链表 的 
创建 以 及 增删 功能 。is_emptyO 判 断 链 表 是 否 为 空 ，lengthO 返 回 链表 的 长 度 ，travel0 用 于 遍历 ，add0 用 于 在 
头 部 添加 一 个 节点 ，appendO0 用 于 在 尾部 添加 一 个 节点 ，insertO 用 于 在 指定 位 置 pos 添加 节点 ，remove() 
用 于 删除 一 个 节点 ，searchO 用 于 查找 节点 是 否 存在 。 


17.3.3” 自 定义 栈 结构 


栈 ， 有 些 地 方 称 为 堆栈 ， 是 一 种 容器 ， 可 存 入 数据 元 素 、 访 问 元 素 、 删 除 元 素 ， 它 的 特点 在 于 只 能 允 
许 在 容器 的 一 端 进行 加 入 数据 和 输出 数据 的 运算 。 由 于 材 数据 结构 只 允许 在 一 端 进行 操作 ， 因 而 按照 后 进 
先 出 的 原理 运作 。 对 栈 的 两 种 主要 操作 是 将 一 个 元 素 压 入 栈 和 将 一 个 元 素 弹出 栈 。 入 栈 使 用 push0 方 法 ， 
出 栈 使 用 pop0 方 法 。 图 17-6 演示 了 入 栈 和 出 栈 的 过 程 。 栈 可 以 用 顺序 表 实现 ， 也 可 以 用 链表 实现 。 


图 17-6 栈 的 基本 结构 
另 一 个 常用 的 操作 是 预览 栈 项 的 元 素 。pop() 方 法 虽然 可 以 访问 栈 项 的 元 素 ， 但 是 调用 该 方法 后 ， 栈 项 


元 素 也 从 栈 中 被 永久 性 地 删除 了 。peek0 方 法 则 只 返回 栈 项 元 素 ， 而 不 删除 它 。 为 了 记录 栈 顶 元 素 的 位 置 ， 
同时 也 为 了 标记 哪里 可 以 加 入 新 元 素 ， 我 们 使 用 变量 top， 当 向 栈 内 压 入 元 素 时 ， 该 变量 增 大 ， 当 从 栈 内 弹 
出 元 素 时 ， 该 变量 减 小 。pushO、pop0 和 peek0 是 栈 的 3 个 主要 方法 ， 但 是 栈 还 有 其 他 方法 和 属性 。 

stack 通常 的 操作 : 


stack() 建立 一 个 空 的 栈 对 象 

push() 把 一 个 元 素 添加 到 栈 的 最 顶层 

Pop() 删除 栈 最 顶层 的 元 素 , 并 返回 这 个 元 素 
peek() 返回 最 顶层 的 元 素 ,并 不 删除 它 
isEmpty () 判断 槛 是 否 为 空 

size() 返回 槛 中 元 素 的 个 数 


下 面 用 一 个 实例 来 熟悉 栈 的 基本 操作 。 
【 例 17-2】 实 现 栈 的 基本 操作 。 
class Node (object) : 
def _init (self, data, next = None) : 
self.data = data 
self.next = next 
class Stack(object) : 
def _ init (self, top = None): 
self.top = top 


def push(self,data): # 创 建新 的 节点 放 到 栈 顶 
self.top = Node(data, self.top) 
def pop (self) : # 拿 出 栈 顶 元 素 ,原来 的 栈 发 生 改变 


if self.top is None: 
return None 

data = self.top.data 

self.top = self.top.next 
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return data 
def peek(self) : ## 查 看 栈 顶 元 素 , 原来 的 栈 不 变 
return self.top.data if self.top is not None else None 
def isEmpty (self): 
return self.peek() is None 


if name ==" main ": 
stack = Stack() 
stackl = stack.push (Hello) 
stackl = stack.push(It’ s me) 
print (stack.peek()) 
stack.pop() 
print (stack.peek()) 


程序 运行 结果 如 图 17-7 所 示 。 


图 17-7 栈 的 基本 操作 


以 上 代码 实现 了 在 表 中 将 新 的 节点 放置 栈 项 ， 存 入 新 的 数据 。 之 后 再 利用 push0 函 数 模块 将 栈 顶 元 素 
取出 改变 原来 的 栈 。 
a 


17.3.4 ”Queue 模块 


队列 是 只 人 允许 在 一 端 进行 插入 操作 ， 而 在 另 一 端 进行 删除 操作 的 线性 表 。 队 列 的 两 种 主要 操作 是 : 向 
队列 中 插入 新 元 素 和 删除 队列 中 的 元 素 。 人 允许 插入 的 一 端 为 队 尾 ， 人 允许 删除 的 一 端 为 队 头 。 插 入 操作 也 叫 
作 入 队 ， 删 除 操作 也 叫 作出 队 。 入 队 操作 在 队 尾 插入 新 元 素 ， 出 队 操 作 删 除 队 头 的 元 素 ， 队 列 不 允许 在 中 
间 部 位 进行 操作 。 

(1) 基本 FIFO 队列 : 队列 是 一 种 先进 先 出 的 线性 表 , 简称 FIFO。 下面 用 一 个 简单 的 实例 来 说 明 Python 
中 Queue 模块 下 的 基本 FIFO 队列 。 

【 例 17-3】FIFO 队列 的 实现 。 

from queue import Queue 

q = Queue (maxsize=5) 

for i in range(5): 

q:put (i) 

while not q.empty(): 

print (q.get ()) 


程序 运行 结果 如 图 17-8 所 示 。 
图 17-8 FIFO 队列 
FIFO 即 First In First Out， 先 进 先 出 。Queue 提供 了 一 个 基本 的 FIFO 容器 ， 使 用 方法 很 简单 ， 最 大 值 
是 个 整数 ， 指 明了 队列 中 能 存放 的 数据 个 数 的 上 限 。 一 旦 达到 上 限 ， 插 入 会 导致 阻塞 ， 直 到 队列 中 的 数据 
被 消费 掉 。 如 果 maxsize 小 于 或 者 等 于 0， 队 列 大 小 没有 限制 。 
(2) 基本 LIFO 队列 : 与 FIFO 不 同 的 是 ，LIFO 采用 的 是 后 进 先 出 的 线性 表 。 下 面 用 一 个 简单 的 实例 
来 说 明 Python 中 Queue 模块 下 的 基本 LIFO 队列 。 
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【 例 17-4】LIFO 队列 的 实现 。 


from queue import LifoQueue 
q = LifoQueue (maxsize=5) 
for i in range(5): 

q.put (i) 
while not q.empty(): 

print (q.get ()) 


程序 运行 结果 如 图 17-9 所 示 。 


图 17-9 LIFO 队列 


LIFO 即 Last In First Out， 后 进 先 出 。Queue 提供 了 一 个 基本 的 LIFO 容器 ， 使 用 方法 与 FIFO 相似 但 又 不 同 。 
(3) 优先 级 队列 Priority Queue: 除了 按 元 素 入 列 顺序 外 ， 有 时 需要 根据 队列 中 元 素 的 特性 来 决定 元 素 
的 处 理 顺序 。 
【 例 17-5】 优 先 级 队列 的 实现 。 
from queue import PriorityQueue 
class Job (object) : 
def _init (self, priority, description): 
self.priority = priority 
self.description = description 
print ('New job:', description) 
return 
def _1t (self, other): 
return self.priority < other.priority 
q = PriorityQueue() 
g.put (Job(5, 'Mid-level job')) 
g.put (Job(10, 'Low-level job')) 
q:Pput (Job (1, 'Important job')) 
while not q.empty(): 
next_job = q.get() 
print ('Processing job', next job.description) 


程序 运行 结果 如 图 17-10 所 示 。 


图 17-10 ”优先 级 队列 


17.4 树 状 结构 


树 状 结构 是 一 类 重要 的 非 线 性 数据 结构 ， 树 是 以 分 支 关系 定义 的 层次 结构 ， 其 中 以 树 和 二 又 树 最 为 常 
用 。 树 状 结构 的 特点 是 ， 元 素 之 间 构 成 层次 关系 ， 除 根 元 素 没 有 前 驱 外 ， 每 个 元 素 都 有 一 个 前 驱 和 若干 个 
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后 继 ， 没 有 父 节 点 的 节点 称 为 根 节点 ， 每 个 节点 有 零 个 或 多 个 子 节点 ， 每 一 个 非 根 节点 有 且 只 有 一 个 父 节 
点 ， 除 了 根 节点 外 ， 每 个 子 节点 可 以 分 为 多 个 不 相交 的 子 树 。 树 的 基本 结构 如 图 17-11 所 示 。 


0 


图 17-11 树 的 基本 结构 


各 17.4.1 构建 树 


前 面 提 到 了 树 的 基本 结构 ， 在 Python 中 ， 可 以 用 说 套 列表 表示 树 。 虽 然 把 界面 写成 列表 的 一 系列 方法 
与 我 们 已 实现 其 他 的 抽象 数据 类 型 有 些 不 同 ， 但 这 样 做 比较 好 ， 因 为 它 为 我 们 提供 一 个 简单 、 可 以 直接 查 
看 的 递归 数据 结构 。 在 列表 实现 树 时 ， 我 们 将 存储 根 节点 作为 列表 的 第 一 个 元 素 的 值 。 列 表 的 第 二 个 元 素 
的 本 身 是 一 个 表示 左 子 树 的 列表 。 这 个 列表 的 第 三 个 元 素 表示 在 右 子 树 的 另 一 个 列表 。 

【 例 17-6】 用 嵌 套 列表 构建 树 。 


2 ee OR A Ne a Rk | 
print (myTree) 

print('left subtree = ', myTree[1]) 

print('root = ', myTree[0]) 

print('right subtree = ', myTree[2]) 


程序 运行 结果 如 图 17-12 所 示 。 


17-12 ” 赃 套 列表 树 


代码 实现 了 用 表 进 行 简单 的 树 的 构建 ,我 们 可 以 使 用 索引 来 访问 列表 的 子 树 。 树 的 根 是 myTree[0]， 根 
的 左 子 树 是 myTree[1]， 右 子 树 是 myTree[2]。 嵌 套 列 表 法 一 个 非常 好 的 特性 就 是 子 树 的 结构 与 树 相同 ， 本 
身 是 递归 的 。 子 树 具有 根 节 点 和 两 个 表示 叶 节点 的 空 列表 。 构 建 完 成 后 ， 便 可 以 访问 左右 子 树 ， 该 代码 的 
树 状 结构 如 图 17-13 所 示 。 

(2) 


17-13 ” 庶 套 列表 构建 树 


17.4.2 二叉树 
二 又 树 是 一 种 特殊 的 树 ， 具 有 如 下 特点 。 每 个 节点 最 多 有 两 棵 子 树 ， 节 点 的 度 最 大 为 2， 左 子 树 和 看 
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子 树 是 有 顺序 的 ， 次 序 不 能 颠倒 ， 即 使 某 节点 只 有 一 个 子 树 ， 也 要 区 分 左右 子 树 。 
它 的 结构 如 图 17-14 所 示 。 


A 
left | right 
B C 
left | right left | right 
2 了 
了 了 
lef | right | [left | reht| [er | right 


17-14 二叉树 结构 


二 叉 树 分 类 很 多 ， 其 中 满 二 叉 树 和 完全 二 叉 树 比较 特殊 ， 因 为 这 两 种 二 叉 树 效率 很 高 。 
满 二 又 树 : 除 叶子 节点 外 的 所 有 节点 均 有 两 个 子 节点 。 节 点 数 达到 最 大 值 。 所 有 叶子 节点 必须 在 同一 
层 上 ， 如 图 17-15 所 示 。 


图 17-15 满 二 叉 树 
完全 二 叉 树 : 设 二 又 树 的 深度 为 k， 除 第 k 层 外 ， 其 他 各 层 (1~k-1) 的 节点 数 都 达到 最 大 个 数 ， 第 
层 所 有 的 节点 都 连续 集中 在 最 左边 ， 如 图 17-16 所 示 。 结 合 完全 二 叉 树 定义 得 到 其 特点 如 下 。 
(1) 叶子 节点 只 能 出 现在 最 下 一 层 〈 满 二 叉 树 继承 而 来 )。 
(2) 最 下 层 叶 子 节点 一 定 集中 在 左 部 连续 位 置 。 
(3) 倒数 第 二 层 ， 如 有 叶子 节点 ， 一 定 出 现在 右 部 连续 位 置 。 
(4) 同样 节点 树 的 二 叉 树 ， 完 全 二 叉 树 的 深度 最 小 。 


17-16 ”完全 二 又 树 


【 例 17-7】 构 建 二 又 树 。 
class BinaryTree: 
def _ init (self,rootobject): 
self.root = rootobject 
self.leftchild = None 
self.rightchild = None 
def insertLeft (self,newNode): 
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if self.leftChild == None: 
self.leftChild = BinaryTree (newNode) 
else: 
print('The LeftChild is not None') 
def insertRight (self,newNode) : 
if self.rightchild == None: 
self.rightchild = BinaryTree (newNode) 
else: 
print('The rightChild is not None. ') 
r = BinaryTree('a') 
print('root:',r.root,';','leftCchild:',r.leftchild,';', "rightchild:',r.rightchild) 
r.insertLeft ('b') 
print('root:',r.root,';','leftCchild:',r.leftchild,';', "rightchild:',r.rightchild) 
print('root:',r.root,';', 'leftCchild.root:',r.leftCchild.root,';', 'rightchild:',r.rightchild) 
r.insertLeft('c') 


程序 运行 结果 如 图 17-17 所 示 。 


图 17-17 构建 二 叉 树 


以 上 代码 构建 了 一 个 简单 的 二 叉 树 类 ， 它 的 初始 化 函数 ， 将 传 入 的 rootObject 赋值 给 selfroot， 作 为 根 
节点 ，leftChild 和 rightChild 都 为 None。insertLeft 函数 为 向 二 又 树 的 左 子 树 赋 值 ， 若 leftChild 为 空 ， 则 先 
构造 一 个 BinaryTree(newNode)， 即 实例 化 一 个 新 的 二 叉 树 ， 然 后 将 这 棵 二 叉 树 赋值 给 原来 的 二 叉 树 的 
leftChild。 此 处 递归 调用 了 BinaryTree 这 个 类 。 若 不 为 空 则 输出 “The rightChild is not None.”。 我 们 向 r 插 
入 了 一 个 左 节点 ， 可 以 看 到 左 节 点 其 实 也 是 一 个 BinaryTree， 这 是 在 插入 时 递归 生成 的 。 


17.4.3 二叉树 的 遍历 


树 的 遍历 是 树 的 一 种 重要 的 运算 。 遍 历 是 指 对 树 中 所 有 节点 的 信息 的 访问 ， 即 依次 对 树 中 每 个 节点 访 
问 一 次 且 仅 访问 一 次 。 树 的 两 种 重要 的 遍历 模式 是 深度 优先 遍历 和 广度 优先 遍历 。 深 度 优先 一 般 用 递归 ， 
广度 优先 一 般 用 队列 。 一 般 情况 下 能 用 递归 实现 的 算法 大 部 分 也 能 用 堆栈 来 实现 。 

(1) 深度 优先 遍历 的 主要 方法 有 以 下 三 种 。 

@ 先 序 遍 历 二 又 树 ， 若 二 叉 树 为 空 ， 则 空 操作 ; 否则 ， 先 访问 根 节点 ， 然 后 递归 使 用 先 序 遍 历 访问 左 
子 树 ， 再 递归 使 用 先 序 遍历 访问 右 子 树 。 

@ 中 序 遍 历 二 叉 树 ， 若 二 又 树 为 空 ， 则 空 操作 ;， 否则， 递归 使 用 中 序 遍 历 访问 左 子 树 ， 然 后 访问 根 节 


点 ， 最 后 再 递归 使 用 中 序 遍 历 访问 右 子 树 。 

图 后 序 遍历 二 又 树 ， 若 二 叉 树 为 空 ， 则 空 操作 ;否则 ， 先 递归 使 用 后 序 遍 历 访 问 左 子 树 和 右 子 树 ， 最 
后 访问 根 节点 。 

(2) 广度 优先 遍历 ， 从 树 的 根 节点 开始 ， 从 上 到 下 从 左 到 右 遍历 整个 树 的 节点 ， 也 被 叫 作 层次 遍历 。 


【 例 17-8】 实 现 深度 优先 遍历 二 叉 树 。 
class BinaryTreeNode(): 
def _init (self, data=None, left=None, right=None): 
self.data = data 
self.left = left 
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self.right = right 
class BinaryTree (object) : 
def _init (self, root=None): 
self.root = root 
def is empty (self): 


return self.root == None 
def preorder (self,BinaryTreeNode): # 先 序 遍历 
if BinaryTreeNode == None: 
return 
print (BinaryTreeNode.data) 4# 先 访问 根 节点 ,再 访问 左 子 树 , 后 访问 右 子 树 


self .preOrder (BinaryTreeNode.1left) 
self.preOrder (BinaryTreeNode .right) 


def inorder (self,BinaryTreeNode): # 中 序 遍 历 
if BinaryTreeNode == None: 
return 


self.inOrder (BinaryTreeNode.1left) 攻 先 访问 左 子 树 , 再 访问 根 节点 ,后 访问 右 子 树 
print (BinaryTreeNode .data) 
self.inorder(BinaryTreeNode .right) 


def postorder (self,BinaryTreeNode): # 后 序 遍历 
if BinaryTreeNode == None: 
return 


self.postorder (BinaryTreeNode.left) 4# 先 访问 左 子 树 , 再 访问 右 子 树 , 后 访问 根 节点 
self.postorder (BinarYyTreeNode .right) 
Print (BinaryTreeNode .data) 
nl = BinaryTreeNode (data: 
n2 = BinaryTreeNode (data= 
n3 = BinaryTreeNode (data="6") 
n4 = BinaryTreeNode (data="2", left=nl1l, right=n2) 
n5 = BinaryTreeNode (data="5", left=n3, right=None) 
root = BinaryTreeNode (data="]1", left=n4, right=n5) 
bt = BinaryTree (root) 
Print (' 先 序 谢 历 ') 
bt .preorder (bt .root) 
Print (' 中 序 遍 历 ') 
bt.inorder (bt.root) 
Print (' 后 序 遍 历 ') 
bt .postorder (bt.root) 


程序 运行 结果 如 图 17-18 所 示 。 


数据 结构 基础 


创建 好 二 叉 树 后 ， 定 义 三 个 函数 模块 preOrder()、inOrder()、 图 17-18 ”深度 优先 遍历 二 叉 树 
postOrder0， 分 别 为 先 序 遍 历 、 中 序 遍历 、 后 序 遍 历 。 根 据 三 种 遍 
历 方式 的 特点 进行 编程 。 


17.5 ”图 形 结构 


图 是 一 种 抽象 的 数学 结构 ， 研 究 抽 象 对 象 之 间 的 一 类 二 元 关系 及 其 拓扑 性 质 ， 数 学 领域 


里 有 一 个 称 为 


论 ” 的 研究 分 支 ， 专 门 研究 这 种 拓扑 结构 。 图 是 一 种 较 线性 表 和 树 更 为 复杂 的 数据 结构 ， 


形 结构 中 节 


点 之 间 的 关系 可 以 是 任意 的 , 图 中 任意 两 个 数据 元 素 之 间 都 可 能 相关 。 在 计算 机 的 数据 结构 领 


域 和 课程 里 ， 
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图 被 看 作 一 类 复杂 数据 结构 ， 可 用 于 表示 具有 各 种 复杂 联系 的 数据 集合 ， 在 实际 应 用 中 非常 广泛 。 图 的 种 
类 有 很 多 种 ， 其 中 常见 的 是 无 向 图 、 有 向 图 、 圈 、 简 单 图 、 连 通 图 等 。 
无 向 图 : 图 中 的 每 条 边 都 没有 方向 ， 边 的 两 个 顶点 没有 次 序 关系 。 
有 向 图 : 图 中 的 每 条 边 都 有 方向 ， 边 的 两 个 项 点 有 次 序 关系 。 
圈 : 图 中 连接 同一 个 项 点 的 边 叫 圈 。 
简单 图 :没有 圈 也 没有 平行 边 的 图 。 
连通 图 ， 在 无 向 图 中 ， 图 中 的 任意 两 个 顶点 都 是 连通 的 图 。 


17.5.1 图 的 抽象 数据 类 型 
图 是 一 种 复杂 的 数据 结构 ， 构 造 中 需要 一 些 有 用 的 操作 ， 其 抽象 数据 类 型 (Abstract Data Type，ADT) 如 下 。 


RDT Graph: 

Graph (self) + 图 的 创建 
is_empty (self) # 空 图 判断 
vertex_ num(self) # 返 回 顶 点 个 数 
edge_num(self) # 返 回 边 的 个 数 
vertices (self) # 获 得 图 中 顶点 的 集合 
edges (self) # 获 得 图 中 边 的 集合 
add vertex (self,vertex) 。 +# 增 加 一 个 顶点 

add edge (self,v1,v2) # 在 v1,v2 间 加 边 
get_ edge (self, v1,v2) # 获 得 边 的 有 关 信 息 
out_edges (self,v) # 获 得 v 的 所 有 出 边 
degree (self,v) # 检 查 v 的 度 


17.5.2 图 的 表示 方式 


图 是 二 维 上 的 平面 结构 ， 并 不 是 我 们 之 前 学 的 那些 简单 的 线性 结构 ， 所 以 它 的 高 效 简洁 表示 存在 一 定 
困难 ， 这 里 介绍 两 种 有 效 的 方式 :“ 邻 接 和 矩阵 ”和 “邻接 表 ”。 

(1) 邻接 矩阵 : 用 矩阵 来 表示 图 ， 采 用 和 矩阵 的 形式 描述 图 中 顶点 之 间 的 关系 。 邻 接 矩 阵 是 图 的 最 基本 
表示 方法 ， 它 是 表示 图 中 顶点 间 邻 接 关系 的 方 阵 ， 对 于 n 个 顶点 的 图 G= (V，E)， 其 邻接 矩阵 是 一 个 nxn 
方 阵 ， 图 中 每 个 项 点 〈 按 顺序 ) 对 应 矩阵 里 的 一 行 一 列 ， 和 珑 阵 元 素 表示 图 中 的 邻接 关系 。 

Aij = w(ij ): 如 果 两 顶点 之 间 有 边 ，w(ij) 为 该 边 的 权 。 

Aij= 0 或 inf: 如 果 两 顶点 之 间 无 边 。 

如 图 17-19 所 示 为 无 向 图 与 邻接 矩阵 。 如 图 17-20 所 示 为 有 向 图 与 邻接 矩阵 。 


17-19 无 向 图 与 邻接 矩阵 
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(2) 邻接 表 : 是 图 
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0140 
二 |0020 
A 5306 
0000 


图 17-20 ”有 向 图 与 邻接 矩阵 


的 一 种 链 式 存储 表示 方法 。 它 是 “邻接 矩阵 ”的 变化 ， 相 对 邻接 矩阵 来 说 更 省 空间 


但 是 不 方便 判断 两 个 顶点 之 间 是 否 有 边 。 如 图 17-21 所 示 为 无 向 图 与 邻接 表 , 如 图 17-22 所 示 为 有 向 图 与 邻 


接 矩 表 。 


es 
人) (<) 1 b —0—2 
3 c 一 0 一 ”1 一 >” 3 
() 3 d 一 2 


17-21 无 向 图 与 邻接 表 


区 
OO 


和 


有 
NE 


图 17-22 ”有 向 图 与 邻接 矩 表 


olo 
D 


17.5.3 用 字典 构建 图 与 搜索 图 


之 前 学 过 列表 是 数据 结构 中 非常 重要 的 内 容 ， 在 线性 结构 中 ， 用 列表 来 创建 表 。 字 典 也 是 Python 中 一 
种 灵活 的 数据 结构 。 二 者 的 主要 差别 在 于 : 列表 是 有 序 的 对 象 集 合 ， 字 典 是 无 序 的 对 象 集 合 ， 且 列表 是 按 


照 偏 移 存 取 数 据 的 ， 而 字典 是 按照 键 存 取 数 据 的 。 在 Python 中 ， 图 主要 是 通过 列表 和 词典 来 构造 的 。 如 


17-14 所 示 的 有 向 图 结构 ， 可 用 以 下 字典 和 列表 的 结合 进行 构造 。 


graph ={ 'A':['B 
'B':['E'], 


EVD 


So 
DE FY], 


"ER 
sD 


【 例 17-9】 搜 索 图 


def find path (gr: 


} 
操作 。 


aph, start, end, path=[]): # 寻 找 一 条 路 径 
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程序 运行 结果 如 图 17-23 所 示 。 
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图 17-23 搜索 图 


此 代码 对 图 17-14 有 向 图 进行 了 搜索 的 操作 。 当 定义 好 图 结构 后 ， 通 过 find_pathO、find_all paths()、 
find_shortest_ pathO 三 个 函数 分 别 实现 寻找 节点 “A” 与 “E” 之 间 的 某 一 条 路 径 、 所 有 路 径 以 及 最 短路 径 。 


17.5.4 图 的 简单 应 用 : 最 小 生成 树 


假定 G 是 一 个 网 络 ， 其 中 的 边 带 有 给 定 的 权 值 ， 可 以 做 出 它 的 生成 树 。 现 将 G 的 一 棵 生成 树 中 各 条 边 
的 权 值 之 和 称 为 该 生成 树 的 权 。 网 络 G 可 能 存在 许多 棵 不 同 的 生成 树 ， 不 同 生成 树 的 权 值 也 有 可 能 不 同 ， 
中 权 值 最 小 的 生成 树 称 为 G 的 最 小 生成 树 。 Kruskal 算法 是 一 种 构造 最 小 生成 树 的 简单 算法 , 其 思想 也 比 
较 简 单 。 其 算法 思想 如 下 。 

(1) 设 G = (V，BE) 是 一 个 网 络 ， 其 中 ，|V| = na。 初始 时 取 包 含 G 中 所 有 n 个 项 点 但 没有 任何 边 的 孤 
立 点 子 图 T-(V,f)，T 里 的 每 一 个 顶点 自 成 一 个 连通 分 量 。 

(2) 将 边 集 E 中 的 边 按 权 值 递增 的 顺序 排列 ， 在 构造 中 的 每 一 步 顺 序 地 检查 这 个 边 序列 ， 找 到 下 一 条 
(最 短 的 ) 两 端点 位 于 T 的 两 个 不 同 连通 分 量 的 边 e， 把 e 加 入 T。 这 导致 两 个 连通 分 量 由 于 边 。 的 连接 而 
变 成 了 一 个 连通 分 量 。 

(3) 每 次 操作 使 T 减 少 一 个 连通 分 量 ， 不 断 重复 这 个 动作 加 入 新 边 ， 直 到 了 中 所 有 项 点 都 包含 在 一 个 
连通 分 量 里 为 止 ， 这 个 连通 分 量 就 是 G 的 一 棵 最 小 生成 树 。 

【 例 17-10】Kruskal 算法 最 小 生成 树 。 

def Kruskal (graph): 

vnum = graph.vertex num() 
reps = [i for i in range (vnum)] 
mst,edges = [],[] 
for vi in range (vnum): 4# 所 有 边 入 表 
for vw in graph.out edges (vi) : 
edges.append ( (w,vi,v)) 
edges .sort () # 按 权 值 排序 
for Ww,vi,vj in edges: 
if reps[vi] != reps[vj]: 
mst .append ( (vi, vi),w) 
if len (mst) == vnum - 1: 
break 


rep,orep = rep[vil,reps[vj] 
for i in range(vnum) : # 合 并 连通 分 量 
if reps[i] == orep: 
reps[i] = rep 
return mst 


该 代码 为 算法 实现 ， 完 整 案例 将 在 课 后 练习 题 中 出 现 。 


17.6 ”查找 与 排序 


在 很 多 程序 中 都 会 用 到 搜索 与 排序 对 数据 进行 操作 。 常 用 的 查找 操作 有 : 顺序 查找 、 二 分 查找 、 哈 希 
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表 查 找 和 二 叉 树 查找 。 常 用 的 排序 操作 有 冒 泡 排序 、 插 入 排序 、 归 并 排序 、 快 速 排 序 、 基 数 排序 、 堆 排 
序 、 直 接 选 择 排序 等 。 本 节 重 点 讲解 顺序 查找 、 二 叉 查 找 、 冒 泡 排序 以 及 二 叉 树 排序 。 


% 17.6.1 ”顺序 查找 有 序列 表 


当 数 据 项 存储 在 诸如 列表 的 集合 中 时 ， 我 们 说 它们 具有 线性 或 顺序 关系 。 每 个 数据 项 都 存储 在 相对 于 
他 数据 项 的 位 置 。 在 Python 列表 中 ， 这 些 相对 位 置 是 单个 项 的 索引 值 。 由 于 这 些 索 引 值 是 有 序 的 ， 可 以 
按 顺序 访问 它们 。 

顺序 查找 ， 即 从 列表 中 的 第 一 个 项 目 开始 ， 按 照 基 本 的 顺序 排序 ， 简 单 地 从 一 个 项 移动 到 另 一 个 项 ， 
直到 找到 正在 寻找 的 项 或 遍历 完整 个 列表 。 如 果 遍 历 完整 个 列表 ， 则 说 明正 在 搜索 的 项 不 存在 。 

【 例 17-11】 顺序 查找 有 序列 表 。 

def sequentialSearch (alist，item) : 
pos = 0 
found = False 
while pos < len(alist) and not found: 


料 


if alist[pos] == item: 
found = True 
else: 


pos = pos + 1 
Feturn found 
| 
print (sequentialSearch (testlist, 3)) 
print (sequentialsearch (testlist, 13)) 


程序 运行 结果 如 图 17-24 所 示 。 


图 17-24 ”顺序 查找 有 序列 表 


此 代码 先 构 建 有 序 表 ， 然 后 用 顺序 查找 的 方式 ， 查 找 有 序 表 中 的 数据 。 若 该 列表 中 有 查找 的 数据 ， 则 
输出 True， 反 之 则 输出 False。 


17.6.2 二 分 查找 有 序列 表 


二 分 查找 的 算法 核心 是 : 在 查找 的 一 组 有 序数 组 中 不 断 取 中 间 元 素 与 查找 值 进行 比较 ， 以 二 分 之 一 的 
倍率 进行 表 范围 的 缩小 ， 若 中 间 元 素 正好 是 查找 元 素 ， 则 查找 结束 。 
【 例 17-12】 二 分 查找 有 序列 表 。 


def binary search(list, key): 
low=0 
high = len(list) -1 
i 下 
while low < high: 
time += 1 
mid = int((low + high) / 2) 
if key < list[mid]: 
high = mid - 1 
elif key > list[mid]: 


258 


low = mid+1 
else: 


# 打 印 折 半 的 次 数 
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print ("搜索 次 数 : $s" $ time) 


return mid 


print ("搜索 次 数 : $s" $% time) 
return False 


if _name ==' main ': 
st es ts et} 
search result = binary search(LIST, 11) 
print (search result) 


程序 运行 结果 如 图 17-25 所 示 。 


17-25 ”二 分 查找 有 序列 表 


此 代码 先 构 村 


0 ] 


示 进 行 二 分 查找 操作 的 次 数 ， 以 及 “11” 的 位 置 。 


17.6.3 


冒 泡 排序 


于 有 序 表 LIST， 然 后 用 二 分 查找 的 方式 ， 查 找 有 序 表 中 的 数据 “11” 的 位 置 。 输 出 结果 显 


冒 泡 排序 是 一 种 简单 的 排序 算法 。 它 一 次 比较 两 个 相 邻 的 元 素 ， 比 较 之 后 将 小 的 元 素 放 在 前 面 ， 将 较 
大 的 元 素 放 在 后 面 ， 再 继续 进行 比较 。 针 对 所 有 元 素 重复 进行 操作 直到 没有 任何 数字 可 以 进行 比较 。 最 终 
实现 将 所 有 数据 从 小 到 大 排序 。 

冒 泡 排序 的 基本 思想 (运作 原理 ) 如 下 。 

(1) 比较 相 邻 的 元 素 ， 如 果 第 一 个 比 第 二 个 大 升序 )， 就 交换 它们 两 个 。 


(2) 对 4 


每 一 对 相 邻 的 元 素 做 同样 的 了 


会 是 最 大 的 数 。 
(3) 针对 所 有 的 元 素 重复 以 上 的 步骤 ， 除 了 最 后 一 个 〈 倒 数 第 二 个 与 其 已 做 比较 )。 
(4) 持续 每 次 对 越 来 越 少 的 元 素 重复 上 面 的 步骤 ， 直 到 没有 任何 一 对 数字 需要 比较 。 


【 例 17- 


13】 冒 泡 排序 。 


def bubble sort 1(list): 
for j in range(len(list)-1,0,-1): 


EL 


for i in range(j): 
if list[i]>1list[i+1]: 


[ 作 ， 从 开始 第 一 对 到 结尾 最 后 一 对 ， 这 一 步 做 


list[i],1ist[i+1]=1ist[i+1],1ist[i] 
return list 


[58,74, 61, 64, 4,2,25] 


print (bubble_sort 1(list)) 


程序 运行 结果 如 图 17-26 所 示 。 


17.6.4 


二 叉 树 排序 


17-26 冒 泡 排序 


二 叉 排 序 树 的 过 程 主要 是 二 又 树 的 建立 和 遍历 的 过 程 , 通过 采取 二 叉 链表 作为 二 又 排序 树 的 存储 结构 ， 
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保持 了 链接 结构 在 插入 和 删除 操作 上 的 优点 。 二 叉 树 排序 具有 下 列 性 质 ， 若 它 的 左 子 树 不 为 空 ， 则 左 子 树 
上 所 有 节点 的 值 均 小 于 它 的 根 结构 的 值 ， 若 它 的 右 子 树 不 为 空 ， 则 右 子 树 上 所 有 节点 的 值 均 大 于 它 的 根 结 
构 的 值 ， 它 的 左 、 右 子 树 也 分 别 为 二 又 排序 树 。 一 个 无 序 的 数列 ， 可 以 通过 二 又 树 中 的 排序 树 变 成 一 个 有 
序数 列 。 当 创建 好 树 后 ， 便 开始 对 树 进行 遍历 ， 对 数据 从 小 到 大 排序 。 

二 叉 排序 树 进行 查找 操作 时 ， 对 比 节点 的 值 和 关键 字 ， 相 等 则 表明 找到 了 ; 小 了 则 往 节点 的 左 子 树 去 
找 ， 大 了 则 往 右 子 树 去 找 ， 这 样 递 归 下 去 ， 最 后 返回 布尔 值 或 找到 的 节点 。 

【 例 17-14】 二 又 排序 树 。 
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程序 运行 结果 如 图 17-27 所 示 。 


17-27 ”二叉树 排序 


17.7 ”就 业 面试 技巧 与 解析 


面试 官 : 什么 是 数据 结构 ? 为 什么 我 们 需要 数据 结构 ? 常用 的 数据 结构 有 哪些 ? 

应 聘 者 : 数据 结构 是 计算 机 存储 、 组 织 数 据 的 方式 。 对 于 特定 的 数据 结构 〈 例 如 数组 )， 有 些 操作 效率 
很 高 〈 读 某 个 数组 元 素 )， 有 些 操作 效率 很 低 〈 删 除 某 个 数组 元 素 )。 程 序 员 的 目标 是 为 当前 的 问题 选择 最 

数据 是 程序 的 核心 要 素 ， 因 此 数据 结构 的 价值 不 言 而 喻 。 无 论 在 写 什么 程序 ， 都 需要 与 数据 打交道 ， 
例如 员工 工资 、 股 票 价格 、 杂 货 清单 或 者 电话 本 。 在 不 同 场景 下 ， 数 据 需 要 以 特定 的 方式 存储 ， 我 们 有 不 
同 的 数据 结构 可 以 满足 我 们 的 需求 。 

常用 的 数据 结构 有 : 数组 、 栈 、 队 列 、 链 表 、 图 、 树 、 前 缀 树 、 哈 希 表 。 
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第 18 章 
数据 库 编程 


学习 指引 
本 章 针对 Python 中 常用 数据 库 ， 以 及 数据 库 的 操作 进行 讲解 。 


WY 重点 导读 


。 了 解 Python 数据 库 应 用 程序 接口 。 

* 掌握 Python 操作 SQLite3 数据 库 的 方法 。 

。 掌 握 Python 操作 MariaDB 数据 库 的 方法 。 
。 掌 握 Python 操作 MongoDB 数据 库 的 方法 。 


18.1 Python 数据 库 应 用 程序 接口 


在 没有 Python DB-API 之 前 ， 各 数据 库 之 间 的 应 用 接口 非常 混乱 ， 实 现 各 不 相同 。 如 果 项 目 需要 更 换 
数据 库 时 ， 则 需要 做 大 量 的 修改 ， 非 常 不 便 。Python DB-API 的 出 现 就 是 为 了 解决 这 样 的 问题 。 


18.1.1 ”数据库 应 用 程序 接口 概述 


Python 所 有 的 数据 库 接口 程序 都 在 一 定 程 度 上 遵守 Python DB-API 规范 。 DB-API 是 一 个 规范 , 它 定义 
了 一 系列 必需 的 对 象 和 数据 库存 取 方 式 ， 以 便 为 各 种 各 样 的 底层 数据 库 系统 和 多 种 多 样 的 数据 库 接口 程序 
提供 一 致 的 访问 接口 。 由 于 DB-API 为 不 同 的 数据 库 提供 了 一 致 的 访问 接口 ， 在 不 同 的 数据 库 之 间 移 植 代 
码 成 为 一 件 轻松 的 事情 。 


1. 模块 属性 
DB-API 规范 规定 数据 库 接口 模块 必须 实现 一 些 全 局 的 属性 以 保证 兼容 性 。 
1) apilevel 


DB-API 模块 兼容 的 DB-API 版 本 号 。apilevel 这 个 字符 串 (不 是 浮 点 数 ) 表示 这 个 DB-API 模块 所 兼容 
的 DB-API 最 高 版 本 号 ， 如 “1.0”“2.0”， 如 果 未 定义 ， 则 默认 是 “1.0”。 
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2) threadsafety 

threadsafety 表示 线程 安全 级 别 ， 是 一 个 整数 ， 取 值 范围 如 下 。 

0: 不 支持 线程 安全 ， 多 个 线程 不 能 共享 此 模块 。 

1: 初级 线程 安全 支持 ， 线 程 可 以 共享 模块 ， 但 不 能 共享 连接 。 

2: 中 级 线程 安全 支持 ， 线 程 可 以 共享 模块 和 连接 ， 但 不 能 共享 游标 。 

3: 完全 线程 安全 支持 ， 线 程 可 以 共享 模块 ， 连 接 及 游标 。 

如 果 一 个 资源 被 共享 ， 就 必须 使 用 自 旋 锁 或 者 是 信号 量 这 样 的 同步 原 语 对 其 进行 原子 目标 锁定 。 对 这 
个 目标 来 说 ， 磁 盘 文件 和 全 局 变量 都 不 可 靠 ， 并 且 有 可 能 妨碍 。 

3) paramstyle 

paramstyle 表示 该 模块 支持 的 SQL 语句 参数 风格 。DB-API 支持 多 种 方式 的 SQL 参数 风格 ， 这 个 参数 
是 一 个 字符 串 ， 表 明 SQL 语句 中 字符 串 替 代 的 方式 。 

4) connect 

connect 方法 生成 一 个 connect 对 象 ， 通 过 这 个 对 象 来 访问 数据 库 。 符 合 标准 的 模块 都 会 实现 connect 
方法 。connect0 函 数 的 参数 如 下 所 示 。 


user Username 
password Password 

host Hostname 
database Database name 
dsn Data source name 


数据 库 连 接 参 数 可 以 以 一 个 DSN 字符 串 的 形式 提供 ,也 可 以 以 多 个 位 置 相关 参 数 的 形式 提供 (如 果 你 
明确 知道 参数 的 顺序 的 话 )， 也 可 以 以 关键 字 参 数 的 形式 提供 。 

下 面 给 出 一 段 代码 : 

connect (dsn="'myhost :MYDB', user='guido',password="'234$') 

不 同 的 数据 库 接口 程序 可 能 有 些 差异 ， 并 非 都 是 严格 按照 规范 实现 ， 例 如 ，MySQLdb 则 使 用 db 参数 
而 不 是 规范 推荐 的 database 参数 来 表示 要 访问 的 数据 库 ， 具 体 代码 如 下 。 

MYSQLdb .connect (host='dbserv'，db='inv'!，user='smith') 

PgsQL.connect (database='sales') 

psycopg.connect (database='t1', user="'pgsql') 


gadfly.dbapi20.connect ('csrDB', '/usr/local/database') 
sqlite3.connect ('marketing/test') 


2. 异常 

兼容 标准 的 模块 也 应 该 提供 以 下 这 些 异常 类 。 
Warning 警告 异常 基 类 

Error 错误 异常 基 类 
InterfaceError 数据 库 接口 错误 
DatabaseError 数据 库 错误 

DataError 处 理 数据 时 出 错 
OperationalError 数据 库 执 行 命令 时 出 错 
IntegrityError 数据 完整 性 错误 
InternalError 数据 库 内 部 出 错 
ProgrammingError SQL 执行 失败 
NotsupportedError 试图 执行 数据 库 不 支持 的 特性 
3. 连接 对 象 


要 与 数据 库 进 行 通信 ， 必 须 先 和 数据 库 建 立 连 接 。 连 接 对 象 处 理 命令 如 何 送 往 服务 器 ， 以 及 如 何 从 服 
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务 器 接收 数据 等 基础 功能 。 连 接 成 功 ( 或 一 个 连接 池 ) 后 就 能 够 向 数据 库 服务 器 发 送 请 求 ， 得 到 响应 。 


4. 方法 

连接 对 象 没有 必须 定义 的 数据 属性 ， 但 至 少 应 该 实现 以 下 这 些 方 法 。 
close() 关闭 数据 库 连 接 

commit () 提交 当前 事务 

rollback() 取消 当前 事务 

cursor () 使 用 这 个 连接 创建 并 返回 一 个 游标 或 类 游标 的 对 象 


errorhandler (cxn, cur, errcls, errval) 

一 旦 执行 了 close0 方 法 ， 再 试图 使 用 连接 对 象 的 方法 将 会 导致 异常 。 

对 不 支持 事务 的 数据 库 或 者 虽然 支持 事务 ， 但 设置 了 自动 提交 (auto-commit) 的 数据 库 系统 来 说 ， 
commit( 方 法 什么 也 不 做 。 如 果 确 实 需要 ， 可 以 实现 一 个 自 定 义 方法 来 关闭 自动 提交 行为 。 由 于 DB-API 
要 求 必 须 实 现 此 方法 ， 对 那些 没有 事务 概念 的 数据 库 来 说 ， 这 个 方法 只 需要 有 一 条 pass 语句 就 可 以 了 。 

类 似 commit0、rollback() 方 法 仅 对 支持 事务 的 数据 库 有 意义 。 执 行 完 rollback0， 数 据 库 将 恢复 到 提交 
事务 前 的 状态 ， 根 据 PEP249， 在 提交 commit0 之 前 关闭 数据 库 连 接 将 会 自动 调用 rollback() 方 法 。 

对 不 支持 游标 的 数据 库 来 说 , cursor0 方 法 仍然 会 返回 一 个 尽量 模仿 游标 对 象 的 对 象 。 这 些 是 最 低 要 求 。 

特定 数据 库 接口 程序 的 开发 者 可 以 任意 为 他 们 的 接口 程序 添加 额外 的 属性 。 


18.1.2 ”数据 库 游标 的 使 用 


一 个 游标 允许 用 户 执行 数据 库 命 令 和 得 到 查询 结果 。 一 个 Python DB-API 游标 对 象 总 是 扮演 游标 的 角 
色 ， 无 论 数据 库 是 否 真正 支持 游标 。 也 就 是 说 ， 数 据 库 接口 程序 必须 实现 游标 对 象 。 创 建 游标 对 象 之 后 ， 
就 可 以 执行 查询 或 其 他 命令 (或 者 多 个 查询 和 多 个 命令 )， 也 可 以 从 结果 集中 取出 一 条 或 多 条 记录 。 

游标 对 象 拥有 的 属性 和 方法 。 

arraysize: 使 用 fechmany() 方 法 一 次 取出 多 少 条 记录 ， 默 认 值 为 1。 

connectionn: 创建 此 游标 对 象 的 连接 〈 可 选 )。 

description: 返回 游标 活动 状态 (一 个 包含 七 个 元 素 的 元 组 name、type_code、display_size、internal size、 
precision、scale、null ok); 只 有 name 和 type_code 是 必须 提供 的 。 

Lastrowid: 返回 最 后 更 新 行 的 这 〈 可 选 )， 如 果 数 据 库 不 支持 行 4d， 默认 返回 None。 

Rowcount: 最 后 一 次 execute0 操 作 返回 或 影响 的 行 数 。 

callproc(func[,args]): 调用 一 个 存储 过 程 。 

close0: 关闭 游标 对 象 。 

execute(op[,args]): 执行 一 个 数据 库 查询 或 命令 。 

executemany(op,args): 类 似 execute0 和 map() 的 结合 ， 为 给 定 的 每 一 个 参数 准备 并 执行 一 个 数据 库 查 
询 /命令 。 

fetchone(): 得 到 结果 集 的 下 一 行 。 

fetchmany([size=cursor.arraysize]): 得 到 结果 集 的 下 面 size 行 。 

fetchall0: 返回 结果 集中 剩 下 的 所 有 行 。 

_iter _0: 创建 一 个 迭代 对 象 ( 可 选 ， 参 阅 next0 )。 

Messages: 游标 执行 后 数据 库 返 回 的 信息 列表 (元 组 集合 ) (可 选 )。 

next0: 使 用 迭代 对 象 得 到 结果 集 的 下 一 行 〈 可 选 ， 类 似 fetchone0， 参阅 _iter 0)。 

nextset0: 移 到 下 一 个 结果 集 (如 果 支 持 的 话 )。 
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rownumber: 当前 结果 集中 游标 的 索引 〈 以 行为 单位 ， 从 0 开始 ) (可 选 )。 

setinput-sizes(sizes): 设置 输入 最 大 值 ( 必 须 有 ， 但 具体 实现 是 可 选 的 )。 

setoutput-size(size[，col])): 设置 数列 的 缓冲 区 大 写 (必须 有 ， 但 具体 实现 是 可 选 的 )。 

游标 对 象 最 重要 的 是 execute0 和 fetch0 方 法 ， 所 有 对 数据 库 服 务 器 的 请 求 都 由 它们 来 完成 。 对 
fetchmany() 方 法 来 说 ， 设 置 一 个 合理 的 arraysize 属性 会 很 有 用 。 当 然 ， 在 不 需要 时 ， 最 好 关 掉 游标 对 象 。 
如 果 数 据 库 支持 存储 过 程 ， 则 可 以 使 用 callproc() 方 法 。 

通常 两 个 不 同系 统 的 接口 要 求 的 参数 类 型 是 不 一 致 的 ， 例 如 Python 调用 C 函数 时 Python 对 象 和 C 类 
型 之 间 就 需要 数据 格式 的 转换 ， 反 之 亦 然 。 类 似 地 ， 在 Python 对 象 和 原生 数据 库 对 象 之 间 也 是 如 此 。 对 于 
了 Python DB-API 的 开发 者 来 说 , 传递 给 数据 库 的 参数 是 字符 串 形式 的 , 但 数据 库 会 根据 需要 将 它 转换 为 多 种 
不 同 的 形式 ， 以 确保 每 次 查询 都 能 被 正确 执行 。 

例如 ， 一 个 Python 字符 串 可 能 被 转换 为 一 个 VARCHAR， 或 一 个 TEXT， 或 一 个 BLOB， 或 一 个 原生 
BINARY 对 象 , 或 一 个 DATE 或 TIME 对 象 。 一 个 字符 串 到 底 会 被 转换 成 什么 类 型 ?必须 小 心地 尽 可 能 以 数 
据 库 期 望 的 数据 类 型 来 提供 输入 ， 因 此 另 一 个 DB-API 的 需求 是 创建 一 个 构造 器 以 生成 特殊 的 对 象 ， 以 便 
能 够 方便 地 将 Python 对 象 转换 为 合适 的 数据 库 对 象 。 以 下 所 列 内 容 描 述 了 可 以 用 于 此 目的 的 类 。SQL 的 
NULL 值 被 映射 为 Pyhton 的 NULL 对 象 ， 也 就 是 None。 

数据 库 的 常用 类 型 如 下 。 

Date (Yr，mo，dy) : 日 期 值 对 象 。 

Time (hr,min, sec) : 时 间 值 对 象 。 

Timestamp (Yr,mo,dy，hr，min, sec) : 时 间 稚 对 象 。 

DateFromTicks (ticks): 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 日 期 。 

TimeFromTicks (ticks): 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 时 间 值 对 象 。 

TimestampFromTicks (ticks): 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 时 间 改 对 象 。 

Binary(string) : 对 应 二 进 制 长 字符 串 值 的 对 象 。 

STRING: 描述 字符 串 列 的 对 象 ， 例 如 VARCHAR。 

BINARY: 描述 二 进 制 长 列 的 对 象 例如 RAW，BLOB。 

NUMBER: 描述 数字 列 的 对 象 。 

DATETIME: 描述 日 期 时 间 列 的 对 象 。 

ROWID: 描述 "row ID" 列 的 对 象 。 


DB-API 操作 数据 库 的 流程 如 图 18-1 所 示 。 


创建 connection 


获取 cursor 


关闭 connection 


18-1 DB-API 操作 流程 
下 面 给 出 一 段 数据 库 操作 实例 ， 具 体 代码 如 下 。 
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import MysQLdb 


# 连 接 数据 库 


A _ 
on 从 入 门 到 项 目 实践 ( 超 值 版 ) 


db_conn = MysQLdb.connect (host = 'localhost', user= 'Mysql-admin', passwd = '123456') 
# 如 果 已 经 创建 了 数据 库 , 可 以 直接 用 如 下 方式 连接 数据 库 


#db_conn = MYSQLdb.connect (host = "localhost", user = "root",passwd = "123456", 
"mmconnect 方法 常用 参数 : 


host: 数据 库 主机 名 ,默认 是 用 本 地 主机 
user: 数据 库 登 录 名 ， 默认 是 当前 用 户 
passwd: 数据 库 登录 的 秘 码 ， 默 认为 空 


db: 要 使 用 的 数据 库 名 ， 


没有 默认 值 


port: MYSQL 服务 使 用 的 TCP 端口 ， 默 认 是 3306 


charset: 数据 库 编码 


# 获 取 操作 游标 


cursor = db_conn.cursor() 


# 使 用 execute 方法 执行 SQL 语句 
Cursor.execute ("SELECT VERSION ()") 


# 使 用 fetchone 方法 获取 一 条 数据 库 
dbversion = cursor.fetchone () 
print ("Database version : %5 " $% dbversion) 


二 创建 数据 库 


cursor.execute ("create database if not exists dbtest") 


# 选 择 要 操作 的 数据 库 


db_conn.select db('dbtest'); 


# 创 建 数据 表 SQL 语句 


5q1 = """CREATE TABLE if not exists employee( 
first name CHAR(20) NOT NULL, 
last name CHAR(20), 


age INT, 
sex CHAR(1), 


income FLOAT )""" 


try: 


cursor.execute (sql) 


except Exception as e: 


#Exception 是 所 有 异常 的 基 类 ,这 里 表示 捕获 所 有 的 异常 


print ("Error to create table:", e) 


+ 插入 数据 


sql = """INSERT INTO employee (first name, 
last_name, age, sex, income) 


VALUES ('%s', 


5', %d, '%5', Sd)""" 


#Sex: Male 男 ，Female 女 


employees = ( 
{"first name™": 
{"first name": 
{"first name": 
{"first name": 
{"first name": 
{"first name": 
) 

try: 

+ 清空 表 中 数据 


"Mac", "last name": "Mohan"，"age": 20, "sex": "M", "income": 2000}, 
"Wei", "last name": "Zhu", "age": 24, "sex": "M", "income": 7500}, 
"Huoty", "last name": "Kong", "age": 24, "sex": "M", "income 8000}, 
"Esenich", "last name": "Lu", "age": 22, "sex": "F", "income": 3500}, 
“xmin", "last name": "Yun", "age": 31, "sex": "F", "income": 9500}, 
"Yxia", "last name": "Fun", "age": 23, "sex": "M", "income"”: 3500} 


cursor.execute ("delete from employee") 


# 执 行 sql 插入 语句 


db = "testdb") 
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18.2 Python 操作 SQLite3 数据 库 


SQLite 是 一 个 轻 量 级 数据 库 ，Python 同样 支持 操作 这 些小 型 数据 库 ，SQLite 数据 库 多 数 用 于 小 型 项 
目 中 。 


18.2.1 SQLite3 数据 库 简介 


SQLite 是 一 款 轻型 的 数据 库 , 是 遵守 ACID 的 关系 型 数据 库 管 理 系统 , 它 包含 在 一 个 相对 小 的 C 库 中 ， 
是 D.RichardHipp 建立 的 公有 领域 项 目 。 它 的 设计 目标 是 炭 入 式 的 ,而 且 目 前 已 经 在 很 多 嵌入 式 产品 中 使 用 
了 它 。 它 占用 资源 非常 少 ， 在 嵌入 式 设 备 中 ， 可 能 只 需要 几 百 千 字 节 的 内 存 就 够 了 。 

SQLite 有 许多 内 置 函 数 用 于 处 理 字符 串 或 数字 数据 。SQLite 内 置 函 数 对 大 小 写 不 敏感 ， 可 以 使 用 这 些 
函数 的 小 写 形式 或 大 写 形式 或 混合 形式 ， 常 用 函数 如 下 。 

。 SQLite COUNT: 用 来 计算 一 个 数据 库 表 中 的 行 数 。 

。 SQLite MAX: 允许 选择 某 列 的 最 大 值 。 

。 SQLite MIN: 人 允许 选择 某 列 的 最 小 值 。 
。 SQLite AVG: 计算 某 列 的 平均 值 。 


SQLite SUM: 允许 为 一 个 数值 列 计算 总 和 。 

SQLite RANDOM: 返回 一 个 介 于 -9 223 372 036 854 775 808 和 +9 223 372 036 854 775 807 的 伪 随 机 
整数 。 

SQLite ABS: 返回 数值 参数 的 绝对 值 。 

SQLite UPPER: 把 字符 串 转换 为 大 写字 母 。 

SQLite LOWER: 把 字符 串 转 换 为 小 写字 母 。 

SQLite LENGTH: 返回 字符 串 的 长 度 。 

SQLite sqlite_version: 返回 SQLite 库 的 版 本 。 

在 确定 是 否 在 应 用 程序 中 使 用 SQLite 之 前 ， 应 该 考虑 以 下 几 种 情况 。 

第 一 ， 有 没有 可 用 于 SQLite 的 网 络 服务 器 。 从 应 用 程序 运行 位 于 其 他 计算 机 上 的 SQLite 的 唯一 方法 
是 从 网 络 共享 运行 。 这 样 会 导致 一 些 问题 ， 像 UNIX@ 和 Windows@ 网 络 共享 都 存在 文件 锁定 问题 。 还 有 由 
于 与 访问 网 络 共享 相关 的 延迟 而 带 来 的 性 能 下 降 问题 。 

第 二 ，SQLite 只 提供 数据 库 级 的 锁定 。 虽 然 有 一 些 增加 并 发 的 技巧 ， 但 是 ， 如 果 应 用 程序 需要 的 是 表 
级 别 或 行 级 别 的 锁定 ， 那 么 DBM 能 够 更 好 地 满足 需求 。 

第 三 ，SQLite 可 以 支持 每 天 大 约 10 000 次 点 击 率 的 Web 站 点 一 并且， 在 某 些 情况 下 ， 可 以 处 理 10 
倍 于 此 的 通信 量 。 对 于 具有 高 通信 量 或 需要 支持 庞大 浏览 人 数 的 Web 站 点 来 说 ， 应 该 考虑 使 用 DBMS 。 
第 四 ，SQLite 没有 用 户 账户 概念 ， 而 是 根据 文件 系统 确定 所 有 数据 库 的 权限 。 这 会 使 强制 执行 存储 配 
额 发 生 困难 ， 强 制 执行 用 户 许可 变 得 不 可 能 。 

第 五 ，SQLite 支持 多 数 〈 但 不 是 全 部 ) 的 SQL92 标准 。 不 受 支 持 的 一 些 功 能 包括 完全 触发 器 支持 和 可 
写 视图 。 


回 丙 漠 六 加 
2 18.2.2 ”SQLite3 数据 库 操作 实例 
由 于 Python 标准 中 已 经 自 带 了 SQLite3 的 库 ， 直 接 导 入 就 可 以 使 用 。 要 使 用 数据 库 ， 首 先 需要 创建 一 
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个 数据 库 ， 并 连接 它 。 
下 面 给 出 一 个 操作 Sqlite 数据 库 实例 ， 具 体 代 码 如 下 。 
(1) 创建 数据 库 的 连接 对 象 和 操作 的 游标 。 


(2) 在 数据 库 中 创建 一 张 表 。 


(3) 向 表 中 插入 数据 。 


(4) 查询 表 中 数据 。 


/AN 
khon 以 入 门 到 硕 目 实 路 ( 超 信 折 ) 
SN 


(5) 更 新 表 中 的 数据 。 


# 筛 选 出 工资 SALARY>88888 的 数据 
sql_update="UPDATE COMPANY SET NRME=" 改 进 版 灭 霸 ' WHERE SRLRRY>88888" 
for row in c.execute(sql update): 

print (row) 


(6) 提交 数据 保存 ， 并 关闭 数据 库 连 接 。 


conn.comit () 
conn.close() 


18.3 ”Python 操作 MariaDB 数据 库 


MariaDB 数据 库 管理 系统 是 MySQL 的 一 个 分 支 , 主要 由 开源 社区 在 维护 ,采用 GPL 授权 许可 MariaDB 
的 目的 是 完全 兼容 MySQL， 包 括 API 和 命令 行 ， 使 之 能 轻松 成 为 MySQL 的 代替 品 。 


8.3.1 MariaDB 数据 库 简 介 


MariaDB 虽然 被 视 为 MySQL 数据 库 的 替代 品 ， 但 它 在 扩展 功能 、 存 储 引擎 以 及 一 些 新 的 功能 改进 方 
面 都 强 过 MySQL。 
而 且 从 MySQL 迁移 到 MariaDB 也 是 非常 简单 的 。 
(1) 数据 和 表 定 义 文件 〈.frm) 是 二 进 制 兼容 的 。 
(2) 所 有 客户 端 API、 协 议和 结构 都 是 完全 一 致 的 。 
(3) 所 有 文件 名 、 二 进 制 、 路 径 、 端 口 等 都 是 一 致 的 。 
(4) 所 有 的 MySQL 连接 器 ,例如 PHP、Perl、Python、Java、.NET、MyODBC、Ruby 以 及 MySQL Connector 
C 等 在 MariaDB 中 都 保持 不 变 。 
(5) mysql-client 包 在 MariaDB 服务 器 中 也 能 够 正常 运行 。 
(6) 共享 的 客户 端 库 与 MySQL 也 是 二 进 制 兼容 的 。 
也 就 是 说 ， 在 大 多 数 情况 下 ， 完 全 可 以 卸载 MySQL 然后 安装 MariaDB， 然 后 就 可 以 像 之 前 一 样 正常 


出 于 实用 的 目的 ，MariaDB 是 同一 MySQL 版 本 的 二 进 制 替代 品 〈 例 如 ，MySQL 5.1 一 MariaDB 5.1、 
MariaDB5.2 和 MariaDB 5.3 是 兼容 的 。MySQL 5.5 将 会 和 MariaDB 5.5 保持 兼容 )， 这 意味 着 : 

(1) 数据 和 表 定 义 文件 〈.frm) 是 二 进 制 兼容 的 。 

(2) 所 有 客户 端 APIs、 协 议和 结构 都 是 相同 的 。 

(3) 所 有 的 文件 名 、 二 进 制 文件 的 路 径 、 端 口 、 套 接 字 等 应 该 是 相同 的 。 

(4) 所 有 MySQL 的 连接 器 (PHP、Python、Perl、Java、NET、MyODBC、Ruby、MySQL、C 连接 器 等 ) 
和 MariaDB 的 不 变 。 

mysql-client 包 还 可 以 与 MariaDB 服务 器 一 起 工作 。 

这 意味 着 在 大 多 数 情况 下 ， 可 以 卸载 MySQL 和 安装 MariaDB， 依 然 工作 得 很 好 〈 不 需要 转换 成 任何 
数据 文件 ， 如 果 使 用 同一 主 版 本 ， 例 如 5.1)。 

MariaDB 有 许多 的 新 选项 、 扩 展 ， 存 储 引 擎 和 Bug 修复 ， 而 MySQL 是 没有 的 。 可 以 在 MariaDB 分 发 
版 本 差异 页 面 找到 不 同 版 本 的 功能 特性 集 。 
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18.3.2 建立 MariaDB 数据 库 操作 环境 


节 将 带领 读者 在 Windows 环境 中 安装 MariaDB 数据 库 ， 并 配置 数据 库 环境 。 


1. 下 载 MariaDB 数据 库 
步骤 1: 打开 官方 网 站 https://mariadb.org/， 如 图 18-2 所 示 。 


号 ES 党 响 


About MariaDB Download Get involved Sponsor or 
donate 
One of the most popular Download the atest Join the community of 
database servers. Made version of MariaDB now. Users and developers: The MariaDB Foundation 
by the original developers chat online visit events a o 
of MySQL Guaranteed lo Er and contribule. both corporate sponsors 
Sstay open source. and individual donors. 


图 18-2 ”MariaDB 官网 首页 
步骤 2， 单 击 Download 按钮 ， 跳 转 至 下 载 页 面 ， 如 图 18-3 所 示 。 


CE 


Download 


MariaDB Serverls evallable in the standard repositories of all major Linux distibutions Just look for the 
package mariadb server using the package manager of your operating system. 
Proceed to downloads mariadb org If you need 
MariaDB for Windows 
MariaDB tor Unux If your current distribution does not provide the verslon of MariaDB you need 
The Galera Cluster version (I not avallable from your Linux distribution) 
Specific plugins or storage engines 
Developers tools, like the Java ODBC, C/C++ or Nodejs connectors (ff not avallable from your Linux 
distbution) 
The MariaD source code 


18-3 ” 单 击 Download 按钮 
步骤 3: 单 击 该 页 面 的 Download 按钮 ， 跳 转 至 版 本 选择 页 面 ， 如 图 18-4 所 示 。 


MariaDB 10.3 Series 
NariaD 10.3 (6 the curent stable rolease of Wana08 Nis bus on Maia08 10.2 wh new features net found mynhee ele 


Soo What ls MartaD6 10 


tor an overlew 


View Al Marap Rale: 


18-4 版 本 下 载 
步骤 4: 单 击 Download 10.3.12 Stable Now 按钮 ， 跳 转 至 该 版 本 系统 选择 页 面 ， 如 图 18-5 所 示 。 
步骤 5: 选择 相应 系统 进行 下 载 ， 这 里 选择 下 载 mariadb-103.12-win64.zip 这 个 文件 。 
2. 安装 MariaDB 数据 库 
步骤 1: 将 下 载 好 的 数据 库 文件 进行 解压 ， 放 到 一 个 可 以 找到 的 目录 即 可 ， 目 录 位 置 不 限 。 
步骤 2: 右 击 操作 系统 的 左下 角 “ 开 始 ”菜单 ， 如 图 18-6 所 示 。 


271 


/FN 
Python 从 入 门 到 项 目 实践 ( 超 值 版 ) 


mariadb-10.3 12-ninx64- ZIP fle Windows x86 64 Cneasam 
dabugsymbaks zip mimcfions 


maiiadb 10 312winx64zi = ZIP fle Windows x35 64 chedsum 


mariadb-10 312-winy64 msi MSI Windows xB5 54 Chedaam 
Package 一 一 - 一 


malladb-10 3 12-win32 zip ZIPme Windows x35 Cnedsam 
matiadb-10.3 12-win32- ZIP fle Windows x85 
debugsymbnls zp 


matadb 10.312n32 | | Wndow xa8 和 
Package Instructions WD) 


18-5 选择 版 本 18.6 “开始 ”菜单 


步骤 3: 选择 菜单 中 的 “运行 ”命令 ， 在 打开 的 “运行 ” 对 话 框 中 输入 “cmd” 命 令 ， 如 图 18-7 所 示 。 
步骤 4， 使 用 “cd” 命 令 将 目录 切换 至 数据 库 解压 文件 中 的 bin 目录 ， 运 行 命令 如 图 18-8 所 示 。 


icrosoft Windows [只 本 10.0. 17763. 104 
回 Vode 为 你 打开 相应 的 程序 (c) 2018 Microsoft Corporation。 保 留 所 有 权利 。 
、 文 或 Internet 资源 


:MUsersNAdministrator>d: 


打开 (O): |cmd 
轩 合用 管理 权限 创建 此 任务 


wm 
图 18-7 cmd 运行 图 18-8 切换 目录 
步骤 5; 在 命令 行 输入 “mysqld --initialize-insecure” 命 令 ， 对 数据 库 进行 初始 化 ， 运 行 命 令 如 图 18-9 
所 示 。 
步骤 6: 右 击 da 一 “属性 ”一 “高 级 系统 设置 ”一 “高 级 ”一 “环境 变量 ”一 在 第 二 个 内 容 
框 中 找到 变量 名 为 Path 的 一 行 ， 双 击 一 将 MariaDB 的 bin 目录 路 径 追 加 到 变 值 值 中 ， 如 图 18-10 所 示 。 


p:\>cd D:\Program Files\mariadb-10. 3. 12-winx64\bin 


D:\Program Files\mariadb-10. 3. 12-winx64\bin> 


SSystemRcots leyctem32 
sratemRect a) 
%SystemAccts SystemI2 Wbem 
%SYSTEMROOTINSystem32\WindowsPowerShell\y1.O\ Er 
%SYSTEMROOTNSystem32\OpenSSH\ 
DAProgram Fles\mariadb-10.3.12-wire6a\bin MD 
Eu) 
To 
icrcsctt Windows 【 腺 本 10.0. 17763. 104] a 
|) 2018 及 crosoft Corporation， 保 留 记 有 权利 . 
bs NAdninictrator>d: We 
:Wed D:\progran Rilesynariadh-10.3. 12-winz6d\bin 
| 
D:\Proeram Files\nariadb-10, 64Vbinymysqld -initial 
019-01-20 17:29:45 0 [Note] nysald (nysald 10.3. 12-WariaD®) 
| 
D:\Proeran Filesmariadb-10.3. 12-winx64\bin; 


本 闷 
图 18-10 添加 环境 变量 


18-9 数据 库 初始 化 
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步骤 7: 在 命令 行 输入 “"D:\Program Files\mariadb-10.3.12- winx64\binmysqld"_install” 命 令 ， 制 作 一 个 
MariaDB 的 系统 服务 ， 执 行 命令 如 图 18-11 所 示 。 


(c) 2018 Microsoft Corporation。 保 六 

:\Users\AdministratorYd: 

:Wed D:\Program Files\mariadb-10. 3. 12-winx64\bin 

p :Eee Files\mariadb-10. 3. 12-winx64\bin>’D:\Program Files\mariadb-10. 3. 12-winx64\bin\mysqld” ~ 
nsta 


Bervice successfully installed. 


D:\Program Files\mariadb-10. 3. 12-winx6d4Vbin>e 


图 18-11 安装 服务 
步骤 8: 在 命令 行 输入 “net start mysql” 命 令 ， 如 图 18-12 所 示 。 


(e) 2018 Microsoft Corporatione 
:\Users\Administrator>d: 

:Wed D:\Program Files\mariadb-10. 3. 12-winx64\bin 

:\Program Files\mariadb-10. 3. 12-winx64\bin>"D: \Program Files\mariadb-10. 3. 12-winx64\bin\mysqld” 


stall 
Service successfully installed. 


:ro yiadb-10. 3. 12-winx64\binynet start mysal 
hy E 
MySQL 服务 已 经 局 动 成 功 。 


D:\Program Files\mariadb-10. 3. 12-winx64\bin> 


图 18-12 启动 服务 
步骤 9， 在 命令 行 输入 “mysql -u root -p” 命 令 可 以 登录 进 服务 器 ， 如 图 18-13 所 示 。 


:\Program Files\mariadb-10. 3. 12-winx64\bin>mysql -u root -p 
nter password: 

elcome to the MariaDB monitor， Conmands end with ; or \g. 

our MariaDB connection id is 9 
Berver version: 10.3. 12-MlariaDB mariadb. org binary distribution 


opyright (c) 2000, 2018, Oracle, MariaDB Corporation Ab and others. 
‘ype 'help;” or ’\h’ for help. Type "\c” to clear the current input statement. 


ariaDB [(none)]> 


18-13 ”登录 数据 库 


18.3.3 MariaDB 数据 库 操作 实例 


配置 完 MariaDB 数据 库 ， 可 以 通过 Python 来 操作 它 ， 首 先 需 要 安装 Python 提供 的 模块 。 
1. 安装 MariaDB 的 Python 模块 
在 Linux 系统 中 使 用 下 面 命令 : 
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sudo apt-get install python-pip python-dev lipmysqlclient-dev 
在 Window 系统 中 使 用 下 面 命令 : 


需要 导入 MariaDB 的 Python 模块 ， 即 import MySQLdb 才能 使 用 Python 对 MariaDB 进行 数据 的 增删 
改 查 等 操作 。 


2. Python 操作 MariaDB 的 入 门 例子 


输出 MariaDB 的 版 本 信息 ， 表 示 成 功 通过 Python 对 MariaDB 进行 查询 操作 。 
3. 创建 Table 
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cursor = conn.cursor() 
5ql = "SELECT * FROM MENU" 
try: 
cursor.execute (sql) 
results = cursor.fetchall() 
for row in results: 
orders = row[0] 
print("%s" % (orders)) 
except: 
print('unable to fetch data') 
conn.close() 


18.4 ”Python 操作 MongoDB 数据 库 


MongoDB 是 一 个 基于 分 布 式 文件 存储 的 数据 库 ， 由 C++ 语言 编写 ， 旨 在 为 Web 应 用 提供 可 扩展 的 高 
性 能 数据 存储 解决 方案 。 


18.4.1 MongoDB 数据 库 简介 


MongoDB 是 一 个 介 于 关系 数据 库 和 非 关系 数据 库 之 间 的 产品 ， 是非 关 系数 据 库 当 中 功能 最 丰富 ， 最 像 
关系 数据 库 的 数据 库 。 它 支持 的 数据 结构 非常 松散 ， 是 类 似 JSON 的 BSON 格式 ， 因 此 可 以 存储 比较 复杂 
的 数据 类 型 。Mongo 最 大 的 特点 是 它 支持 的 查询 语言 非常 强大 , 其 语法 有 点 儿 类 似 于 面向 对 象 的 查询 语言 ， 
几乎 可 以 实现 类 似 关系 数据 库 单 表 查 询 的 绝 大 部 分 功能 ， 而 且 还 支持 对 数据 建立 索引 。 

MongoDB 数据 库 的 特点 : 高 性 能 ， 易 部 署 ， 易 使 用 ， 存 储 数据 非常 方便 。 

其 主要 功能 特性 如 下 。 

(1) 面向 集合 存储 ， 易 存储 对 象 类 型 的 数据 。 

(2) 模式 自由 。 

(3) 支持 动态 查询 。 

(4) 支持 完全 索引 ， 包 含 内 部 对 象 。 

(5) 支持 查询 。 

(6) 支持 复制 和 故障 恢复 。 

(7) 使 用 高 效 的 二 进 制 数据 存储 ， 包 括 大 型 对 象 如 视频 等 )。 

(8) 自动 处 理 碎片 ， 以 支持 云 计算 层次 的 扩展 性 。 

(9) 支持 Ruby、Python、Java、C++、PHP、C# 等 多 种 语言 。 

(10) 文件 存储 格式 为 BSON (一 种 JSON 的 扩展 )。 

(11) 可 通过 网 络 访问 。 

数据 被 分 组 存储 在 数据 集中 ,被 称 为 一 个 集合 (Collection)。 每 个 集合 在 数据 库 中 都 有 一 个 唯一 的 标识 
名 ， 并 且 可 以 包含 无 限 数目 的 数据 。 集 合 的 概念 类 似 于 关系 型 数据 库 (RDBMS) 里 的 表 (Table), 不 同 的 
是 它 不 需要 定义 任何 模式 (Schema)。Nytro MegaRAID 技术 中 的 闪存 高 速 缓存 算法 ， 能 够 快速 识别 数据 库 
内 大 数据 集中 的 热 数据 ， 提 供 一 致 的 性 能 改进 。 

模式 自由 意味 着 对 于 存储 在 MongoDB 数据 库 中 的 文件 ， 不 需要 知道 它 的 任何 结构 定义 。 如 果 需 要 的 
话 ， 完 全 可 以 把 不 同 结构 的 文件 存储 在 同一 个 数据 库 里 。 

存储 在 集合 中 的 数据 ， 被 存储 为 键 - 值 对 的 形式 。 键 用 于 唯一 标识 一 个 数据 ， 为 字符 串 类 型 ， 而 值 则 可 
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以 是 各 种 复杂 的 文件 类 型 。 我 们 称 这 种 存储 形式 为 BSON (Binary Serialized Document Format)。 

MongoDB 已 经 在 多 个 站 点 部 署 ， 其 主要 场景 如 下 。 

(1) 网 站 实时 数据 处 理 。 它 非常 适合 实时 的 插入 、 更 新 与 查询 ， 并 具备 网 站 实时 数据 存储 所 需 的 复制 
及 高 度 伸 缩 性 。 

(2) 缓存 。 由 于 性 能 很 高 ， 它 适合 作为 信息 基础 设施 的 缓存 层 。 在 系统 重启 之 后 ， 由 它 搭建 的 持久 化 
缓存 层 可 以 避免 下 层 的 数据 源 过 载 。 

(3) 高 伸缩 性 的 场景 。 非 常 适合 由 数 十 或 数 百 台 服 务 器 组 成 的 数据 库 ， 它 的 路 线 图 中 已 经 包含 对 
MapReduce 引擎 的 内 置 支持 。 

不 适用 的 场景 如 下 

(1) 要 求 高 度 事务 性 的 系统 。 

(2) 传统 的 商业 智能 应 用 。 

(3) 复杂 的 跨 数 据 〈 表 ) 级 联 查 询 。 


“18.4.2 ”建立 MongoDB 数据 库 操作 环境 


配置 MongoDB 数据 库 ， 需 要 先 下 载 MongoDB 数据 库 安 装 文件 ， 安 装 后 配置 相应 的 环境 。 

建立 MongoDB 数据 库 操 作 环 境 需要 以 下 几 个 步骤 。 

步骤 1: 打开 官方 网 站 https://www.mongodb.com/download-center/community, 打开 后 选择 相应 的 版 本 
进行 下 载 ， 如 图 18-14 所 示 。 


4.0.5 (curent Ielease) Windows 6+-bll «64 


i 


https//iastdl mongodo org/win32/mongodo-wir32-736_E€4-2008pls-ss-405-signe 


18-14 ”下载 页 面 


步骤 2: 启动 安装 程序 ， 如 图 18-15 所 示 ， 单 击 Next 按钮 。 
步骤 3: 选中 许可 协议 ， 如 图 18-16 所 示 ， 单 击 Next 按钮 。 


End User License Aoreement 
Welcome to the MongoDB 4.0.5 Pease reod the falonine leese og cement csrefaly 
2008R2Plus SSL (64 bit) Setup Wizard 
License 
We eo Wawd liretol Morgue 40.5 mom sy VERSION 1. OCTOBER 16. 2018 
Done 
Copyright © 2018 MongoDB, jnc 
Everyone is pemiiticd to copy aad distiibute verbaiim copics of this 
icense document but changing # not alowed. 
TERMS AND CONDITIONS 
racept the termein the Licenee Agreement 
Ne oe Pmt Cr 


18-15 ”启动 安装 程序 图 18-16 ”允许 安装 
步骤 4: 单 击 Custom 按钮 自 定义 安装 ， 如 图 18-17 所 示 。 


276 


第 国 章 “数据库 编程 


步骤 5: 设置 安装 路 径 ， 如 图 18-18 所 示 。 


Choose Setup mpe [| 
Choose the setup bype that best suts your needs pp 四 


Sec pe voy you want ahrcs be nialed, 


Oe he ienen the tee baon D dirge Ra 
a 
ET 
二 站 二 
bo 
CE 
有 lows users to choose which program features will be installed and wher= 
‘they will be installed. Recommended for advanced users. This feature requires 113K3 on your 
Se 
a 


9, The 
Subfeatres reqJre 566ME on your 
| rd drve. 


Loraton: ciprogmn FiesMorgona erent O\ RE 
Bek Nest Cone ee ae Bd mee] carce | 
18-17” 自 定义 安装 18-18 配置 安装 路 径 


步骤 6: 配置 启动 服务 ， 默 认 选 中 Install MongoDB as a Service， 这 里 需要 取消 选中 ， 如 图 18-19 所 示 ， 
如 果 没 有 取消 可 能 需要 很 长 时 间 才 能 安装 完成 。 
步骤 7: 单 击 Install 按钮 ， 开 始 安装 ， 如 图 18-20 所 示 。 
| 


FE 
四 


Service Configurabon 
二 Ready to install MongoDB 4.0.5 2008R2plus SSL (64 bit | 


DD instal MongoDB aaa service 
sevee ts Nemwok Servee woer kk natal to begn the insalaton, Cick Back oreyiew or change any of your 
nstalaton settngs. Cck Cancel to eat he wzard. 


25 a bcal or doman ser 


Account Name: 上 
Moontpassword 一 一 


b pr 


a ee a 
图 18-19 配置 安装 服务 图 18-20 开始 安装 
步骤 8: 安装 完成 后 会 有 一 个 同意 许可 协议 ， 单 
击 Agree 按钮 ， 如 图 18-21 所 示 。 resere ry eectene mondng tio Ageanort ortho Solre one dm 
至 此 便 配置 完了 MongoDB 数据 库 环境 。 pe 


18.4.3 MongoDB 数据 库 基础 图 18-21 同意 许可 


MongoDB 是 目前 最 流行 的 NoSQL 数据 库 之 一 ， 使 用 数据 类 型 BSON (类 似 JSON)。Python 要 连接 
MongoDB 需要 MongoDB 驱动 ， 这 里 使 用 PyMongo 驱动 来 连接 。 

1. 安装 PyMongo 

python3 -m pip3 install pymongo 

也 可 以 指定 安装 的 版 本 : 


python3 -m pip3 install pymongo==3.5.1 


更 新 pymongo 命令 : 
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python3 -m pip3 install --upgrade pymongo 

2. 创建 数据 库 

创建 数据 库 需 要 使 用 MongoClient 对 象 ， 并 且 指 定 连接 的 URL 地 址 和 要 创建 的 数据 库 名 。 

这 里 给 出 一 个 创建 数据 库 的 实例 ， 具 体 代码 如 下 。 

import pymongo 

myclient = pymongo.Mongoclient ("mongodb://localhost:27017/") 

mydb = myclient["db"] 

注意 : 在 MongoDB 中 ,数据库 只 有 在 内 容 插 入 后 才 会 创建 ， 也 就 是 说 ， 数 据 库 创 建 后 要 创建 集合 ( 数 
据 表 ) 并 插入 一 个 数据 (记录 )， 数 据 库 才 会 真正 创建 。 

3. 判断 数据 库 是 否 已 存在 

可 以 读 取 MongoDB 中 的 所 有 数据 库 ， 并 判断 指定 的 数据 库 是 否 存 在 。 

这 里 给 出 一 个 判断 数据 库 是 否 存在 的 实例 ， 具 体 代 码 如 下 。 

import pymongo 

myclient = pymongo.Mongoclient ('mongodb://localhost:27017/') 

dblist = myclient.list database names() 

if "db" in dblist: 

print ("数据 库 已 存在 ! ") 

注意 : database names 在 最 新 版 本 的 Python 中 已 废弃 ，Python 3.7+ 之 后 的 版 本 改 为 list_database_ 
names()。 

4. 创建 集合 

MongoDB 中 的 集合 类 似 SQL 中 的 表 。 

这 里 给 出 一 个 MongoDB 使 用 数据 库 对 象 来 创建 集合 的 实例 ， 具 体 代 码 如 下 。 

import pymongo 

myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 

mydb = myclient["db"] 

mycol = mydb["test"] 

注意 : 在 MongoDB 中 ， 集 合 只 有 在 内 容 插入 后 才 会 创建 ， 创 建 集合 (数据 表 ) 后 要 再 插入 一 个 数据 
(记录 ) ， 集 合 才 会 真正 创建 。 

5. 判断 集合 是 否 已 存在 

可 以 读 取 MongoDB 数据 库 中 的 所 有 集合 ， 并 判断 指定 的 集合 是 否 存在 。 

这 里 给 出 一 个 判断 数据 库 集合 是 否 存在 的 实例 ， 具 体 代 码 如 下 。 

myclient = pymongo.Mongoclient ('mongodb://localhost:27017/') 

mydb = myclient[ ‘db’] 

Collist = mydb. list collection names () 

if "sites" in collist: 4# 判 断 sites 集合 是 否 存在 

print ("集合 已 存在 ! ") 


和 18.4.4 ”MongoDB 数据 库 操作 实例 


本 节 讲解 使 用 Python 操作 MongoDB 数据 库 。 数 据 库 操作 涉及 增加 数据 、 删 除数 据 、 修 改 数据 、 查 询 
数据 、 数 据 排序 ， 简 称 数据 库 的 增删 改 查 排 。 
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1. 增加 数据 
MongoDB 中 的 一 个 数据 类 似 SQL 表 中 的 一 条 记录 。 
1) 插入 集合 


往 集合 中 插入 数据 使 用 insert_one0 方 法 ， 该 方法 的 第 一 参数 是 字典 name => value 对 。 
下 面 给 出 一 段 向 集合 中 插入 数据 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.Mongoclient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
mydict = { "name": “百度 "， "alexa": "10000", "url": "https://www.baidu.com" } 
= mycol.insert one (mydict) 
print (x) 
2) 返回 id 字段 
insert_one() 方 法 返回 InsertOneResult 对 象 ， 该 对 象 包 含 inserted_id 属性 ， 它 是 插入 数据 的 id 值 。 
下 面 给 出 一 段 返回 _id 字段 的 实例 ， 具 体 代码 如 下 。 
import pymongo 
myclient = pymongo.MongoCclient ('mongodb://localhost:27017/') 
mydb = myclient['db'] 
mycol = mydb["test"] 
mydict = { "name": "Google", "alexa": "1", "url": "https://www.google.com" } 
x = mycol.insert one (mydict) 
Print (x.inserted id) 
注意 : 如 果 在 插入 数据 时 没有 指定 id，MongoDB 会 为 每 个 数据 添加 一 个 唯一 的 id。 
3) 插入 多 个 数据 
往 集合 中 插入 多 个 数据 使 用 insert_many0 方 法 ， 该 方法 的 第 一 个 参数 是 字典 列表 。 
下 面 给 出 一 段 插入 多 个 数据 的 实例 ， 具 体 代码 如 下 。 
import pymongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb ["test"] 
mylist = [ 
{ "name": "Taobao"，"alexa": "100"， "url": "https://www.taobao.com" }, 
"name": "QQ", "alexa": "101", "url": "https://www.qq.com"” }, 
"name": "Facebook", "alexa": "10", "url": "https://www.facebook.com"” }, 
"name": " 知 乎 "，"alexa": "103", "url": "https://www.zhihu.com" }, 
"name": "Github", "alexa": "109", "url": "https://www.github.com" } 
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] 
x = mycol.insert many (mylist) 
# 输 出 插入 的 所 有 数据 对 应 的 _id 值 


print (x.inserted ids) 

insert_ many() 方 法 返回 InsertManyResult 对 象 ,该 对 象 包含 inserted_ids 属性 , 该 属性 保存 着 所 有 插入 数 
据 的 过 值 。 

4) 插入 指定 id 的 多 个 数据 

除了 插入 数据 有 MongoDB 自动 添加 的 id 外 ， 也 可 以 自己 指定 过 插入 。 

下 面 给 出 一 段 插入 指定 _id 的 多 个 数据 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
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mycol = mydb["test"] 
mylist = [ 
{ "_id": 1，"name": 百度 "cn_name": "百度 搜索 "}， 
{ "_id": 2，"name": "Google"，"address": "Google 搜索 "}， 
{ "_id": 3, "name": "Facebook"，"address": " 脸 书 "}， 
{ ”id": 4, "name": "Taobao", "address" "淘宝 "}， 
{ "id": 5, "name": "Zhihu", "address": " 知 乎 "} 
] 
x = mycol.insert many (mylist) 
# 输 出 插入 的 所 有 数据 对 应 的 _id 值 


print (x.inserted ids) 
2. 删除 数据 
MongoDB 为 删除 数据 提供 了 delete_one() 方 法 、delete_many() 方 法 ， 其 中 ，delete_one() 方 法 可 以 删除 单 


条 数据 ， 而 delete_ many() 方 法 则 可 以 删除 多 条 数据 。 
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1) 删除 单条 数据 
读者 可 以 使 用 delete_one() 方 法 来 删除 一 个 数据 , 该 方法 的 第 一 个 参数 为 查询 对 象 , 指定 要 删除 哪些 数据 。 
下 面 给 出 一 段 删除 name 字段 值 为 “Taobao” 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.MongoCclient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
myquery = { "name": "Taobao" } 
mycol.delete_ one (myquery) 
+ 删除 后 输出 
for x in mycol.find() : 
print (x) 


2) 删除 多 个 数据 

读者 可 以 使 用 delete_ many() 方 法 来 删除 多 个 数据 ,该 方法 的 第 一 个 参数 为 查询 对 象 , 指定 要 删除 哪些 数据 。 
下 面 给 出 一 段 删除 所 有 name 字段 中 以 “F” 开 头 的 数据 实例 ， 具 体 代码 如 下 。 

import pymongo 

myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 

mydb = myclient["db"] 

mycol = mydb["test"] 

myquery = { "name": {"$regex": "^F"} } 

x = mycol.delete many (myquery) 

print (x.deleted_count，" 个 文档 已 删除 ") 


3) 删除 集合 中 的 所 有 数据 
delete many() 方 法 如 果 传 入 的 是 一 个 空 的 查询 对 象 ， 则 会 删除 集合 中 的 所 有 文档 。 
下 面 给 出 一 段 删除 集合 中 的 所 有 数据 的 实例 ， 具 体 代 码 如 下 。 


import pymongo 

myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 

mycol = mydb["test"] 

x = mycol.delete many({}) 

print (x.deleted_count，" 个 文档 已 删除 ") 


3. 修改 数据 
读者 可 以 在 MongoDB 中 使 用 update_one() 方 法 修改 数据 中 的 记录 。 该 方法 的 第 一 个 参数 为 查询 的 条 件 ， 
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第 二 个 参数 为 要 修改 的 字段 。 


如 果 查 找到 的 匹配 数据 多 于 一 条 ， 则 只 会 修改 第 一 条 。 
下 面 给 出 一 段 将 alexa 字段 的 值 10000 改 为 12345 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
myquery = { "alexa": "10000" } 
newvalues = { "$set": { "alexa": "12345" } } 
mycol.update one (myquery, newvalues) 
# 输 出 修改 后 的 "sites” 集合 
for x in mycol.find() : 
Print (x) 
update_ one() 方 法 只 能 修改 匹配 到 的 第 一 条 记录 ， 如 果 要 修改 所 有 匹配 到 的 记录 ， 可 以 使 用 update many0。 
下 面 给 出 一 段 查找 所 有 以 “F” 开 头 的 name 字段 ， 并 将 匹配 到 所 有 记录 的 alexa 字段 修改 为 123 的 实 
具体 代码 如 下 。 
import pymongo 
myclient = pymongo.MongoCclient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
myquery = { "name": { "Sregex": "^F" } } 
newvalues = { "$set": { "alexa": "123" } } 
x = mycol.update many (myquery, newvalues) 
print (x.modified_count，" 数 据 已 修改 ") 


4. 查询 数据 

MongoDB 中 使 用 了 find 和 find_one 方法 来 查询 集合 中 的 数据 ， 类 似 于 SQL 中 的 SELECT 语句 。 
1) 查询 一 条 数据 

读者 可 以 使 用 find_one() 方 法 来 查询 集合 中 的 一 条 数据 。 

下 面 给 出 一 段 查询 一 条 数据 的 实例 ， 具 体 代码 如 下 。 


import pymongo 

myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient ["db"] 

mycol = mydb["test"] 

x = mycol.find one() 

print (x) 


2) 查询 集合 中 所 有 数据 
find() 方 法 可 以 查询 集合 中 的 所 有 数据 ， 类 似 SQL 中 的 SELECT * 操 作 。 
下 面 给 出 一 段 查询 集合 中 所 有 数据 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.MongoClient (“mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb ["test"] 
for x in mycol.find() : 
print (x) 


3) 查询 指定 字段 的 数据 
读者 可 以 使 用 find0 方 法 来 查询 指定 字段 的 数据 ， 将 要 返回 的 字段 对 应 值 设置 为 1。 
下 面 给 出 一 段 查询 指定 字段 的 数据 的 实例 ， 具 体 代码 如 下 。 
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_id 不 能 在 一 个 对 象 中 同时 指定 0 和 1， 如 果 设 置 了 一 个 字段 为 0， 则 其 他 都 为 1， 反之 亦 然 。 
下 面 给 出 一 段 排除 alexa 字段 外 的 查询 实例 ， 具 体 代码 如 下 。 


4) 根据 指定 条 件 查 询 
读者 可 以 在 fnd0 中 设置 参数 来 过 滤 数 据 。 
下 面 给 出 一 段 根据 指定 条 件 查询 的 实例 ， 具 体 代码 如 下 。 


5) 高 级 查询 

在 查询 的 条 件 语 句 中 ， 还 可 以 使 用 修饰 符 。 

例如 ， 读 取 name 字段 中 第 一 个 字母 ASCI 值 大 于 HH 的 数据 ， 修 饰 符 条 件 为 {"$gt": "H"}。 
下 面 给 出 一 段 高 级 查询 的 实例 ， 具 体 代 码 如 下 。 


6) 使 用 正则 表达 式 查 询 
还 可 以 使 用 正则 表达 式 作为 修饰 符 。 
正则 表达 式 修饰 符 只 用 于 搜索 字符 串 的 字段 。 例 如 ， 用 于 读 取 name 字段 中 第 一 个 字母 为 R 的 数据 ， 


正则 表达 式 修饰 符 条 件 为 {"Sregex": "^R"}。 
下 面 给 出 一 段 使 用 正则 表达 式 查询 的 实例 ， 具 体 代码 如 下 。 
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print (x) 
7) 返回 指定 条 数 记 录 
如 果 要 对 查询 结果 设置 指定 条 数 的 记录 ， 可 以 使 用 limit0 方 法 ， 该 方法 只 接受 一 个 数字 参数 。 
下 面 给 出 一 段 返回 指定 条 数 记录 的 实例 ， 具 体 代码 如 下 。 
import pymongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
myresult = mycol.find() .1imit(3) 
+ 输出 结果 
for x in myresult: 
print (x) 
5. 数据 排序 
sort0 方 法 可 以 指定 升序 或 降序 排序 。 
sort() 方 法 的 第 一 个 参数 为 要 排序 的 字段 ， 第 二 个 字段 指定 排序 规则 ，1 为 升序 ，-1 为 降序 ， 默 认为 


升序 。 
下 面 给 出 一 段 将 数据 进行 升序 排序 的 实例 ， 具 体 代 码 如 下 。 


import PYmongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
mydoc = mycol.find() .sort ("alexa") 
for x in mydoc: 
print (x) 


下 面 给 出 一 段 对 字段 alexa 按 降 序 排序 的 实例 ， 具 体 代码 如 下 。 


import pymongo 
myclient = pymongo.MongoClient ("mongodb://localhost:27017/") 
mydb = myclient["db"] 
mycol = mydb["test"] 
mydoc = mycol.find() .sort ("alexa", -1) 
for x in mydoc: 
print (x) 


18.5 ”就 业 面 试 技巧 与 解析 


数据 库 在 实际 面试 中 经 常会 被 问 到 ， 由 于 涉及 数据 库 的 操作 比较 多 ， 因 此 很 多 面试 官 会 问 到 数据 库 事 
物 的 一 些 特性 以 及 数据 库 优化 。 

数据 库 事务 的 ACID 特性 如 下 。 

(1) 原子 性 (Atomicity): 事务 中 的 全 部 操作 在 数据 库 中 是 不 可 分 割 的 ， 要 么 全 部 完成 ， 要 么 均 不 执行 。 

(2) 一 致 性 (Consistency): 几 个 并 行 执行 的 事务 ， 其 执行 结果 必须 与 按 某 一 顺序 串 行 执行 的 结果 相 一 致 。 

(3) 隔离 性 (Isolation): 事务 的 执行 不 受 其 他 事务 的 干扰 ， 事 务 执行 的 中 间 结 果 对 其 他 事务 必须 是 透明 的 。 

(4) 持久 性 (Durability): 对 于 任意 已 提交 事务 ， 系 统 必须 保证 该 事务 对 数据 库 的 改变 不 被 丢失 ， 即 使 
数据 库 出 现 故障 。 

数据 库 优化 查询 效率 可 以 通过 以 下 几 个 步骤 。 

(1) 存储 引擎 选择 : 如 果 数据 表 需 要 事务 处 理 ， 应 该 考虑 使 用 InoDB (支持 事物 存储 引擎 )， 因 为 它 
完全 符合 ACID 特性 。 如 果 不 需要 事务 处 理 ， 使 用 MyISAM (默认 存储 引擎 ) 是 比较 明智 的 。 
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(2) 分 表 分 库 。 

(3) 对 查询 进行 优化 ， 要 尽量 避免 全 表 扫 描 ， 首 先 应 考虑 在 where 及 order by 涉及 的 列 上 建立 索引 。 

(4) 应 尽量 避免 在 where 子 句 中 对 字段 进行 null 值 判断 ， 否 则 将 导致 引擎 放弃 使 用 索引 而 进行 全 表 
扫描 。 

(5) 应 尽量 避免 在 where 子 句 中 使 用 != 或 人 > 操作 符 ， 否 则 将 导致 引擎 放弃 使 用 索引 而 进行 全 表 扫描 。 

(6) 应 尽量 避免 在 where 子 句 中 使 用 or 来 连接 条 件 ， 如 果 一 个 字段 有 索引 ， 一 个 字段 没有 索引 ， 将 导 
致 引擎 放弃 使 用 索引 而 进行 全 表 扫描 。 

(7) Update 语句 ， 如 果 只 更 改 一 两 个 字段 ， 不 要 Update 全 部 字段 ， 否 则 频繁 调用 会 引起 明显 的 性 能 消 
耗 ， 同 时 带 来 大 量 日 志 。 

(8) 对 于 多 张大 数据 量 (这 里 几 百 条 就 算 大 了 ) 的 表 进 行 JOIN 操作 ， 要 先 分 页 再 JOIN， 否 则 罗 辑 读 
会 很 高 ， 性 能 很 差 。 


18.5.1 ”面试 技巧 与 解析 (一) 


面试 官 : char 和 varchar 有 何 区 别 ? 

应 聘 者 : 

#har 类 型 ， 定 长 ， 简 单 粗暴 ， 浪 费 空间 ， 存 取 速 度 快 。 
#varchar 类 型 : 变 长 ， 精 准 ， 节 省 空间 ， 存 取 速 度 慢 。 


18.5.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : 列举 常见 的 关系 型 数据 库 和 非 关 系 型 数据 库 都 有 哪些 ? 
应 聘 者 : 

关系 型 : MySQL，SQL Server，Oracle，Sybase，DB2。 

非 关系 型 Redis，MongoDB。 
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Python 创建 完成 后 ， 对 于 数据 库 的 后 期 管理 与 维护 也 是 数据 库 管理 人 员 必 备 的 技能 。 本 篇 就 来 介绍 
了 Python 的 高 级 应 用 ， 包 括 Python 网 络 编程 、Web 网 站 编程 、 基 于 tkinter 的 GUI 界面 编程 等 。 通 过 本 篇 的 
学 习 ， 读 者 对 Python 的 后 期 管理 与 维护 能 力 会 有 极 大 的 提高 。 


。 第 19 章 网 络 编程 
。 第 20 章 Web 网 站 编程 技术 
。 第 21 章 基于 tkinter 的 GUI 界面 编程 


第 19 章 
网 络 编程 


> 学 习 指引 


网 络 编程 是 在 日 常 工作 中 出 现 频率 很 高 的 应 用 场景 ，Python 作为 一 种 强大 的 语言 ， 封 装 了 库 ， 用 来 支 
持 很 多 常见 的 网 络 协议 。 因此，Python 也 是 一 个 强大 的 网 络 编程 工具 。 除 此 之 外 ，Python 还 提供 了 用 于 网 
络 编程 和 通信 的 各 种 模块 ， 本 章 将 会 学 习 各 个 模块 的 功能 及 用 途 。 


二 ”重点 导读 
。 网 络 编程 的 基本 知识 。 


。 利 用 socket 模块 进行 网 络 编程 。 

。 利 用 urllib 模块 进行 网 络 编程 。 

。 利 用 http 模块 进行 网 络 编程 。 

* 利用 ftplib 模块 进行 网 络 编程 。 

。 利 用 poplib 和 smtplib 模块 进行 网 络 编程 。 


19.1 网 络 编程 基础 


信息 技术 之 所 以 如 此 火爆 ， 与 网 络 的 普及 是 密切 联系 的 。 自 互联 网 诞生 以 来 ， 个 人 计算 机 市 场 呈 井喷 
式 增长 ， 计 算 机 得 以 走 进 了 千家 万 户 ， 现 在 几乎 所 有 的 程序 都 和 网 络 有 关 ， 无 论 是 我 们 在 计算 机 上 用 浏览 
器 浏览 网 页 ， 还 是 在 手机 APP 中 获取 消息 ， 网 络 编程 无 处 不 在 。 网 络 的 本 质 在 于 信息 的 传递 ， 网 络 编程 实 
质 就 是 在 两 个 或 两 个 以 上 的 设备 之 间 传 输 数据 以 及 研究 如 何在 程序 中 实现 两 合计 算 机 的 通信 。 下 面 对 计 算 
机 网 络 的 基本 知识 进行 介绍 ， 为 接 下 来 学 习 各 个 网 络 编程 库 打 下 坚实 的 基础 。 


19.1.1 ”什么 是 计算 机 网 络 


一 般 来 说 ， 将 分 散 的 多 人 台 计 算 机 、 终 端 和 外 部 设备 用 通信 线路 互联 起 来 ， 彼 此 间 实 现 互相 通信 ， 并 且 
计算 机 的 硬件 、 软 件 和 数据 资源 大 家 都 可 以 共同 使 用 ， 实 现 资源 共享 的 整个 系统 被 称 为 计算 机 网 络 ， 它 是 
计算 机 技术 和 通信 技术 相 结合 的 产物 。 

计算 机 网 络 的 基本 分 类 包括 三 种 : 局 域 网 (LAN)、 城 域 网 (MAN)、 广 域 网 (WAN)。 三 者 根据 使 
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场景 和 作用 范围 不 同 分 别 具 有 各 自 的 定义 。 
局 域 网 (Local Area Network，LAN)， 指 在 近 距 离 内 具有 很 高 数据 传输 速率 的 物理 网 络 ， 覆 盖 范围 在 
几米 到 几 千 米 之 间 ， 如 以 太 网 、 令 牌 总 线 网、 令 牌 环 网 等 。 

城 域 网 (Metropolitan Area Network, MAN), 通常 是 指 作用 在 WAN 与 LAN 之 间 , 其 运行 方式 与 LAN 
相似 ， 但 距离 可 以 到 5 一 50 km 的 网 络 。 

广域网 (Wide Area Network，WAN)， 又 称 远程 网 ， 通 常 是 指 作 用 范围 为 几 十 到 几 千 千 米 的 网 络 。 

人 们 平时 用 到 的 互联 网 就 属于 广域网 ， 通 过 访问 互联 网 上 的 信息 ， 即 使 用 户 的 计算 机 与 服务 器 远 隔 干 
里 ， 甚 至 处 于 不 同 的 国家 ， 都 可 以 很 轻松 地 将 用 户 想 要 的 数据 通过 互联 网 返回 到 用 户 的 计算 机 上 。 


19.1.2 网络 协议 


网 络 协议 是 为 计算 机 网 络 中 进行 数据 交换 而 建立 的 规则 、 标 准 或 约定 的 集合 。 它 是 网 络 上 所 有 设备 
(网 络 服务 器 、 计 算 机 路 由 器 等 ) 之 间 通 信 规 则 的 集合 ， 它 规定 了 通信 时 信息 必须 采用 的 格式 和 这 些 格式 的 
意义 。 常 见 的 网 络 协议 有 : TCP/IP 协议 、IPX/SPX 协议 、NetBEUI 协议 等 。 

网 络 协议 由 三 个 要 素 组 成 ，Q@ 语 义 ， 语 义 是 解释 控制 信息 每 个 部 分 的 意义 ， 它 规定 了 需要 发 出 何 种 控 
制 信息 ， 以 及 完成 的 动作 与 做 出 什么 样 的 反应 ，@ 语 法 ， 语 法 是 用 户 数 据 与 控制 信息 的 结构 与 格式 ， 以 及 
数据 出 现 的 顺序 ，@ 时 序 ， 时 序 是 对 事件 发 生 顺 序 的 详细 说 明 (也 可 称 为 同步 )。 
网 络 上 的 计算 机 又 是 如 何 交换 信息 的 呢 ?就 像 我 们 说 话 用 某 种 语言 一 样 , 在 网 络 上 的 各 台 计 算 机 之 间 也 
有 一 种 语言 ， 这 就 是 网 络 协议 ， 不 同 的 计算 机 之 间 必 须 使 用 相同 的 网 络 协议 才能 进行 通信 。 网 络 协议 也 有 
很 多 种 ,具体 哪 一 种 协议 则 要 视 情 况 而 定 ,Intermet 上 的 计算 机 使 用 的 是 最 重要 的 一 个 协议 一 一 TCP/IP 协议 。 
使 用 了 简化 的 OSI 的 TCP/IP 协议 是 一 个 四 层 的 体系 结构 ， 包 括 应 用 层 、 运 〈 传 ) 输 层 、 网 际 ( 络 》 层 和 网 
络 接口 层 ， 如 表 19-1 所 示 。 


表 19-1 TCP/IP 协议 表 


层 协 议 
应 用 层 FIP、TELNET、SMTP、RIP、DNS、DFS、HTTP 等 
传输 层 TCP、UDP 等 
网 络 层 ICMP、IP、ARP、RARP 等 
网 络 接口 层 Etherent、ARPANET 等 


19.1.3 ”地 址 与 端口 


对 于 网 络 编程 来 说 ， 最 主要 的 是 计算 机 和 计算 机 之 间 的 通信 ， 那 么 首先 要 解决 的 问题 就 是 如 何 让 相互 
通信 的 两 台 或 多 台 计 算 机 在 网 络 上 互相 找到 对 方 并 可 以 通过 对 方 的 定位 将 信息 传送 过 去 ， 这 时 候 就 需要 人 Pp 
地 址 的 概念 了 。 

为 了 能 够 方便 地 识别 网 络 上 的 每 个 设备 ， 网 络 中 的 每 个 设备 都 会 有 一 个 唯一 的 数字 标识 ， 这 个 就 是 人 P 
地 址 。 目 前 广泛 使 用 的 下 地址 是 IPv4 协议 版 本 的 地 址 ， 使 用 32 位 二 进 制 代码 标识 网 络 地 址 。 为 了 便于 阅 
读 ， 在 IPv4 中 将 32 位 二 进 制 代码 划分 为 4 个 8 位 二 进 制 代码 ， 并 将 其 转换 为 十 进 制 数 。 也 就 是 说 ， 卫 地 
址 是 由 4 个 0~255 的 数字 组 成 ， 段 与 段 之 间 用 句点 隔 开 ， 例 如 122.10.34.43 。 每 个 接 入 网 络 的 计算 机 都 拥 
有 唯一 的 他 地 址 ， 这 个 他 地 址 可 以 是 固定 的 ， 这 样 用 户 就 可 以 记 住 你 的 瑟 地 址 ， 以 后 再 访问 时 直接 填写 
就 可 以 了 ， 例 如 网 络 上 各 种 各 样 的 服务 器 ， 也 可 以 是 动态 的 ， 例 如 通过 ADSL 等 方式 上 网 的 计算 机 ， 但 是 
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无 论 以 何 种 方式 获得 ， 每 个 计算 机 在 联网 以 后 都 必须 拥有 一 个 唯一 的 合法 的 他 地址。 

不 过 即使 写成 了 4 个 十 进 制 数 ，IP 地 址 仍然 是 不 容易 记忆 的 ， 为 方便 记忆 ， 人 们 又 创造 了 一 个 概 
域名 (Domain Name)。 域名 是 由 若干 个 从 a 到 z 的 26 个 拉丁 字母 及 0~9 的 10 个 阿拉 伯 数 字 及 “-” 
“.” 符 号 构成 并 按 一 定 的 层次 和 逻辑 排列 ， 与 IP 地 址 相对 应 的 一 串 容易 记忆 的 字符 ， 例 如 taobao.com。 一 
个 他 地 址 可 以 对 应 多 个 域名 ， 但 是 一 个 域名 只 能 对 应 一 个 他 地址。 

在 网 络 中 传输 的 数据 ， 都 是 以 人 P 地 址 作为 地 址 标识 ， 所 以 在 实际 传输 以 前 需 将 域名 通过 DNS 服务 器 转换 
为 下 地址 ， 当 我 们 的 计算 机 想 要 和 一 个 远程 机 器 连接 时 ， 可 以 首先 通过 DNS 服务 器 将 域名 解析 为 瑟 地 址 ， 例 
如 在 通过 浏览 器 访问 taobao.com 时 ， 首 先 会 通过 DNS 服务 器 查询 淘宝 网 的 他 地 址 ， 在 查找 到 IP 地 址 后 ， 再 
向 该 他 地 址 发 送 网 络 请 求 ， 之 后 我 们 想 要 的 淘宝 网 的 页 面 ， 就 会 被 服务 器 返回 给 浏览 器 。 

卫 地 址 和 域名 很 好 地 解决 了 如 何在 网 络 中 找到 一 个 计算 机 的 问题 ， 但 是 一 全 服务 器 上 不 可 能 只 运行 一 
个 网 络 服务 程序 ， 为 了 访问 同一 台 服 务 器 上 的 不 同 网 络 服务 程序 ， 又 需要 引入 另外 一 个 概念 端口 
(Port)。 端 口 是 软 件 层面 上 的 概念 ， 一 台 服 务 器 可 以 向 外 提供 多 种 服务 ， 例 如 一 台 服 务 器 可 以 是 Web 服务 
器 ， 也 可 以 同时 是 FTP 服务 器 , 还 可 以 是 邮件 服务 器 。 这 些 服务 都 对 应 同一 个 了 P 地 址 , 但 是 却 对 应 了 不 同 
端口 号 。 例 如 常用 的 FTP 协议 端口 号 为 21，HTTP 常用 端口 为 80， 开 发 Web 服务 器 也 可 以 使 用 80 端口 。 
这 样 ， 通 过 开放 不 同 的 端口 ， 计 算 机 中 的 不 同 网 络 服务 可 以 同时 与 外 界 进行 互 不 干扰 的 通信 。 


念 


19.2 套 接 字 的 使 用 


socket 又 称 “ 套 接 字 ”， 应 用 程序 通常 通过 套 接 字 向 网 络 发 出 请 求 或 者 应 答 网 络 请 求 ， 使 主机 间或 者 一 
人 台 计 算 机 上 的 进程 间 可 以 通信 。TCP/IP 协议 中 的 TCP 和 UDP 都 是 通过 socket 来 实现 的 。socket 基本 上 是 
两 个 端点 程序 之 间 的 信息 通道 ， 它 的 主要 作用 就 是 在 不 同 进程 (不 同 主机 ) 之 间 相 互 传递 消息 ， 以 达到 网 
络 通 信 的 目的 。 

socket 包括 两 个 部 分 ;服务 器 端 和 客户 端 。 服 务 器 端 需要 首先 建立 一 个 socket 对 象 ， 并 等 待 客户 端的 
连接 ， 一 旦 有 客户 端 连接 成 功 ， 两 者 就 可 以 进行 交互 了 。 相 比 于 客户 端 编程 ， 服 务 器 端 编程 就 要 更 复杂 一 
些 ， 因 为 客户 端 只 是 简单 地 连接 、 完 成 事务 、 断 开 连 接 。 而 服务 器 端 必须 随时 准备 处 理 客户 端的 连接 ， 同 
时 还 要 响应 多 个 客户 端的 请 求 ， 所 以 ， 每 个 连接 都 需要 一 个 新 的 进程 或 者 新 的 线程 来 处 理 ， 否 则 ， 服 务 器 
端 就 只 能 服务 一 个 客户 端 了 。 

了 Python 提供 了 两 个 级 别 访问 的 网 络 服务 。 低 级 别 的 网 络 服务 支持 基本 的 socket， 它 提供 了 标准 的 BSD 
Sockets API， 可 以 访问 底层 操作 系统 socket 接口 的 全 部 方法 。 高 级 别 的 网 络 服务 模块 SocketServer， 它 提供 
了 服务 器 中 心 类 ， 可 以 简化 网 络 服务 器 的 开发 。 

在 Python 中 ，socket 模块 是 作为 一 个 内 置 模块 存在 的 ， 所 以 不 需要 进行 额外 的 下 载 ， 只 需要 在 Python 
中 直接 导入 即 可 ， 使 用 下 面 的 这 行 代码 导入 socket 模块 。 

import socket 

导入 后 就 可 以 使 用 socket 模块 了 。socket 模块 提供 了 许多 不 同 的 函数 ， 用 来 实现 各 种 各 样 的 功能 而 不 用 知 
晓 底层 原理 ， 方 便 开 发 人 员 使 用 。 下 面 会 通过 不 同 的 使 用 场景 一 一 介绍 各 个 常用 的 函数 。 


9.2.1 用 socket 建立 服务 器 端 程序 


建立 服务 器 端 程序 的 第 一 步 是 创建 一 个 套 接 字 , 通常 情况 下 , 我 们 使 用 socket 模块 的 socketO 函 数 来 创 
建 一 个 套 接 字 ， 函 数 原型 如 下 所 示 。 
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socket .socket ([family[, type[l, proto]]]) 


socketO 函 数 的 参数 列表 及 解释 如 表 19-2 所 示 。 


表 19-2 socket() 函 数 参数 列表 


函数 解 释 
familyO 套 接 字 家 族 可 以 是 AFUNIX 或 者 AFINET 
type0 套 接 字 类 型 可 以 根据 是 面向 连接 的 还 是 非 连接 的 分 为 SOCK_STREAM 或 SOCK DGRAM 


protocol0 一 般 不 填 ， 默 认为 0 
几乎 所 有 的 网 络 编程 都 要 从 创建 套 接 字 开始 ， 这 是 必 不 可 少 的 一 步 ， 这 几 个 参数 都 是 可 选 参数 ， 不 过 
在 一 般 的 情况 下 ， 不 传 入 任何 参数 ， 直 接 使 用 默认 值 就 可 以 了 。 
在 创建 套 接 字 后 ， 需 要 将 套 接 字 绑 定 到 一 个 固定 的 地 址 。bind0 函 数 用 于 将 socket 绑 定 到 一 个 特定 的 地 
址 和 端口 ， 需 要 填 入 的 地 址 和 端口 的 格式 为 (hostport) 的 元 组 ， 可 以 通过 程序 获得 相关 的 参数 后 ， 将 其 包 
装 为 元 组 然后 再 赋值 ， 其 函数 原型 如 下 所 示 。 
socket .bind (host,port) 


bind0 函 数 的 参数 列表 及 解释 如 表 19-3 所 示 。 
表 19-3 bind() 函 数 参数 列表 


套 接 字 所 对 应 的 主机 名 


套 接 字 所 对 应 的 端口 号 


绑 定 socket 之 后 就 可 以 开始 侦 听 连接 , 来 应 对 由 客户 端 发 起 的 连接 请 求 , 需要 将 socket 变 成 侦 听 模式 。 
socket 的 listen0 函 数 可 以 用 于 实现 侦 听 模式 ， 其 函数 原型 如 下 。 

Socket .1isten (backlog) 

在 调用 listen0 函 数 后 ， 套 接 字 就 会 开始 TCP 监听 。backlog 参数 用 来 指定 在 拒绝 连接 之 前 ， 操 作 系统 
可 以 挂 起 的 最 大 连接 数量 。 该 值 至 少 为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 。 

服务 器 端 套 接 字 开始 监听 后 , 它 就 可 以 接受 客户 端的 连接 , 当 一 个 客户 端 发 起 请 求 后 , 可 以 使 用 acceptO 
函数 来 接受 请 求 。 调 用 acceptO 函 数 后， 就 开启 了 一 个 简单 的 《〈 单 线程 ) 服务 器 ， 它 会 等 待 客户 端的 连接 。 
默认 情况 下 ，acceptO 是 阻塞 的 ， 也 就 是 说 执行 被 暂停 ， 直 到 一 个 连接 到 达 。 然 后 返 匠 由 新 建 的 与 客户 
端的 socket 连接 和 客户 端 地 址 组 成 的 元 组 ， 服 务 器 在 处 理 完 与 该 客户 端的 连接 后 ， 再 次 调用 accept0 函 数 开 
始 等 待 下 一 个 连接 。 这 个 过 程 通常 是 在 一 个 无 限 循环 中 实现 的 ，acceptO 函 数 的 函数 原型 如 下 所 示 。 

socket .accept () 

调用 accept0 函 数 后 ， 套 接 字 会 被 动 接受 TCP 客户 端 连接 ，( 阻 塞 式 ) 的 等 待 连接 的 到 来 。 当 连接 到 来 
时 则 继续 执行 后 面 的 代码 对 连接 进行 处 理 ， 处 理 完成 后 ， 如 是 在 一 个 无 限 循环 中 ， 则 会 再 次 调用 accept() 
函数 ， 等 待 下 一 个 连接 的 到 来 。 

到 此 为 止 ， 服 务 器 套 接 字 构建 流程 基本 上 就 结束 了 ， 现 在 我 们 的 套 接 字 已 经 具备 了 和 客户 端 通信 的 能 
力 ， 接 下 来 可 以 使 用 scoket 模块 的 send0 函 数 将 特定 的 消息 传递 给 客户 端 ， 其 函数 原型 如 下 所 示 。 

socket .send (datal[, flag]) 

通过 调用 send0 函 数 ， 可 以 发 送 TCP 数据 ， 将 string 中 的 数据 发 送 到 连接 的 套 接 字 ， 返 回 值 是 要 发 送 
的 字 节 数量 ， 该 数量 可 能 小 于 string 的 字 节 大 小 。flag 提供 有 关 消 息 的 其 他 信息 ， 通 常 可 以 忽略 。 

当 我 们 向 客户 端 发 送 完 所 有 的 消息 之 后 ， 需 要 关闭 套 接 字 连接 ， 从 而 释放 服务 器 资源 ， 如 果 只 连接 不 
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释放 套 接 字 资 源 的 话 ， 如 果 连 接 建 立 的 多 了 ， 服 务 器 的 内 存 就 会 被 消耗 列 尽 ， 无 法 继续 进行 服务 ， 所 以 关 
闭 套 接 字 连 接 是 整个 网 络 编程 中 很 重要 的 一 环 。 可 以 通过 调用 close0 函 数 来 关闭 一 个 套 接 字 连 接 ， 其 函数 
原型 如 下 所 示 。 

socket .close() 

到 此 为 止 ， 我 们 已 经 学 习 了 在 服务 器 端 创建 整个 套 接 字 流 程 中 所 要 用 到 的 大 部 分 函数 ， 下 面 通过 一 个 
例子 对 以 上 所 学 的 每 一 个 分 解 步骤 进行 复习 ， 同 时 了 解 建立 服务 器 端 程序 的 完整 流程 ， 详 细 代码 如 例 19-1 
所 示 。 

【 例 19-1】 建 立 服务 器 端 程序 。 

#!/usr/bin/python 

= Coding UTE=8 =»= 


import socket # 导 入 socket 模块 
5 = socket.socket () 4 创建 socket 对 象 
host = socket.gethostname () # 获 取 本 地 主机 名 
port = 23333 # 设 置 端口 
5.bind( (host, port)) # 绑 定 端口 
5s.listen(5) 4 等 待 客户 端 连接 
While True: 

c, addr = 5.accept() # 建 立 客户 端 连接 


print (' 连 接地 址 :'，，addr) 
c.send(' 你 好 ,这 里 从 服务 器 端 发 来 的 消息 !' .encode () ) + 发 送 消 息 
c.closel() +# 关 闭 连 接 
本 例 中 ， 首 先 通过 调用 socket 函数 来 创建 一 个 套 接 字 ， 然 后 通过 gethostname0 函 数 来 获取 本 服务 器 的 
主机 名 ， 然 后 为 主机 选择 一 个 端口 号 ， 这 里 建议 选择 稍 大 的 端口 号 ， 可 以 减少 遇见 端口 号 已 被 占用 错误 的 
可 能 性 。 然 后 将 地 址 和 端口 号 打包 成 一 个 元 组 ， 通 过 bind0) 函 数 进行 绑 定 。 绑 定 成 功 后 ， 通 过 listen0) 函 数 
设置 套 接 字 监听 来 自 客户 端的 请 求 ， 然 后 进入 等 待 接收 的 无 限 循环 ， 当 没有 接收 到 请 求 时， 程序 会 阻塞 在 
acceptO 函 数 而 不 会 继续 向 下 进行 ， 当 收 到 一 个 客户 端 请 求 时 ， 通 过 print0 函 数 来 打印 连接 的 地 址 ， 然 后 通 
过 send0 函 数 向 客户 端 发 送 一 条 消息 ， 由 于 我 们 使 用 Python 3， 所 以 在 传递 字符 串 时 需要 调用 encode0 函 数 
对 字符 串 进行 编码 ， 相 应 地 在 客户 端 需要 调用 decode(O) 函 数 进行 解码 。 在 一 切 都 完成 后 ， 记 得 使 用 close() 
函数 来 关闭 服务 器 的 套 接 字 连 接 ， 释 放 服 务 器 资源 。 


:19.2. 2” 用 socket 建立 客户 端 程序 


相 比 于 用 socket 建立 服务 器 端 程 序 而 言 ， 建 立 客户 端 程序 要 简单 得 多 。 前 面 已 经 讲 到 ， 所 有 的 套 接 字 
都 是 通过 socket.socket0 创 建 的 ， 当 客户 端 创 建 了 一 个 套 接 字 时 ， 就 可 以 调用 connect0 函 数 来 连接 服务 器 ， 
其 函数 原型 为 : 

socket .connect (address) 

这 里 的 address 的 参数 格式 和 在 服务 器 端 使 用 的 bindO 函 数 所 接受 的 参数 类 型 是 相同 的 ， 需 要 提供 想 要 
连接 的 服务 器 的 主机 名 和 端口 号 ， 然 后 将 其 打包 为 元 组 ， 再 传递 给 connect0 函 数 。 

当然 , 服务 器 端 有 发 送信 息 的 函数 ， 那 么 在 客户 端 就 有 用 来 接收 消息 的 函数 。 可 以 通过 recv0 函 数 来 接 
收 从 服务 器 端 发 过 来 的 数据 ， 其 函数 原型 如 下 所 示 。 


recv (buffersize[,flag]) 
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这 里 的 buffersize 代表 其 缓冲 区 的 大 小 ， 也 就 是 要 接收 的 最 大 的 数据 量 ， 对 于 接收 的 TCP 数据 ， 数 据 
以 字符 串 形 式 返 回 。flag 提供 有 关 消息 的 其 他 信息 ， 通 常 可 以 忽略 。 

下 面 通 过 一 个 例子 来 介绍 建立 客户 端 程序 的 完整 流程 ， 详 细 代码 如 例 19-2 所 示 。 

【 例 19-2】 建 立 客户 端 程 序 。 


#!/usr/bin/python 
#-*— Coding: UTF-8 -—*— 


import socket # 导 入 socket 模块 

= socket.socket () ## 创 建 socket 对 象 

host = socket.gethostname () 专 获取 本 地 主机 名 

port = 23333 # 设 置 端口 号 

s.connect ((host, port)) 4 连接 服务 器 Deaktopspy thond sorver. py 本 
print (s.recv(1024) .decode () ) # 打 印 接收 到 的 数据 连接 地 址 : 。('172.33.142.226'，64868) 
s.close() # 关 闭 连 接 释 放 资 源 


本 例 中 ， 和 服务 器 端 程序 相同 ， 首 先 建立 套 接 字 ， 然 
后 指定 主机 名 和 端口 号 ， 这 里 要 注意 主机 名 和 端口 号 是 想 
要 连接 的 服务 器 端的 主机 名 和 端口 号 ， 这 里 之 所 以 使 用 
gethostname 是 因为 在 测试 本 程序 时 ， 客 户 端 和 服务 器 端 是 
同时 运行 在 一 台 主 机 上 的 ， 在 实际 使 用 情况 中 ， 这 里 要 用 i i 
实际 的 服务 器 端 主机 名 代替 。 在 设置 好 参数 后 ， 就 可 以 连 DesktopSpython3 client.py 9 
接 服务 器 了 ， 之 后 ， 会 等 待 服务 器 端 发 回 消息 ， 接 收 到 发 。 |&skop 全 和 有 和 生生 和 
可 的 消息 后 ,通过 print0 函 数 将 其 打印 在 界面 上 ,最 后 不 要 
忘记 使 用 close0 函 数 关闭 连接 。 
现在 ， 客 户 端 和 服务 器 端的 程序 都 写 好 了 ， 可 以 分 别 
将 两 段 程序 保存 为 server.py 和 client.py, 然后 打开 两 个 终端 
同时 运行 两 个 程序 。 首 先 打 开 服 务 器 程序 ， 然 后 再 打开 客 


户 端 程序 ， 就 可 以 看 到 两 个 程序 进行 通信 的 结果 了 ， 结 果 
如 图 19-1 所 示 。 图 19-1 服务 器 端 和 客户 端 通信 测试 


19.2.3 用 socket 建立 基于 UDP 的 服务 器 与 客户 端 程序 


上 文中 提 到 的 服务 器 端 和 客户 端 程序 均 基于 TCP， 但 是 同样 地 ， 基 于 UDP 的 服务 器 也 可 以 通过 socket 
库 很 容易 地 被 创建 ， 由 于 没有 底层 的 连接 ， UDP 服务 器 相对 于 TCP 服务 器 来 讲 实现 起 来 更 加 简单 。 一 个 典 
型 的 UDP 服务 器 可 以 接收 到 达 的 数据 和 客户 端 地 址 ， 如 果 服 务 器 需要 做 出 回应 ， 它 要 给 客户 端 回 发 一 个 数 
据 报 。 发 送 和 接收 会 分 别 使 用 socket 中 的 sendto0 和 recvfrom0 函 数 ， 虽然 snd0 和 recv0 函 数 也 可 以 达到 同 
样 的 效果 ， 但 是 前 面 两 个 函数 更 广泛 地 应 用 在 UDP 中 。 

Sendto0 函 数 和 recvfrom0 函 数 原型 分 别 为 : 


socket .sendto (bufsize[, flags]) 
socket .recvfrom(bytes,address) 


sendto0 函 数 和 recvfrom0O) 函 数 的 参数 列表 及 解释 如 表 19-4 所 示 。 
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表 19-4 sendto() 和 recvfrom() 函 数 参 数 


参数 名 解释 
bufsize 缓冲 区 的 大 小 ， 也 就 是 最 大 接收 数据 的 量 
bytes 要 发 送 的 数据 
address 发 送信 息 的 目标 地 址 


使 用 UDP 时 ， 不 需要 建立 连接 ， 只 需要 知道 对 方 的 IP 地 址 和 端口 号 ， 就 可 以 直接 发 数据 包 ， 但 是 能 
不 能 到 达 就 不 知道 了 。 虽 然 用 UDP 传输 数据 不 可 靠 ， 但 它 的 优点 是 ， 和 TCP 比 速度 快 ， 对 于 不 要 求 可 靠 
到 达 的 数据 ， 就 可 以 使 用 UDP。 首先 看 看 服务 器 端 程序 ， 详 细 代码 如 例 19-3 所 示 。 

【 例 19-3】 基 于 UDP 的 服务 器 端 程序 。 

import socket 

5 = socket.socket (socket.AF INET, socket.SOCK_DGRAM) # 定 义 socket 类 型 ,网 络 通信 ,UDP 

s.bind(('127.0.0.1', 2333)) # 绑 定 IP 地 址 及 端口 

print (' 创 建 UDP 服务 器 成 功 ') 


while True: 


data, addr = s.recvfrom(1024) # 接 收 数 据 
print (' 客 户 端 地 址 $s:%5.' % addr) 
s.sendto(b'Hello, %s!' % data, addr) #4 返回 数据 


本 例 中 ， 首 先 创 建 套 接 字 ，SOCK_DGRAM 指定 了 这 个 socket 的 类 型 是 UDP。 比 定 端口 和 TCP 一 样 ， 
但 是 不 需要 调用 listen0 函 数 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 。 当 收 到 数据 时 ， 会 打印 接收 到 的 客户 
端的 地 址 ， 然 后 使 用 sendto0 函 数 向 客户 端 程序 发 出 一 声 问候 。 从 以 上 代码 中 可 以 看 到 ，UDP 服务 器 相 比 
于 TCP 服务 器 没有 那么 多 的 设置 ， 除 了 创建 套 接 字 和 绑 定 本 机 地 址 之 外 没有 其 他 的 设置 。 无 限 循环 中 包含 
接收 数据 和 发 送 数据 。 
UDP 客户 端 是 在 上 面 提 及 的 所 有 客户 端 中 步 又 最 简单 的 , 代 |besktopSoython3 ss py 
码 最 短 的 。 客 户 端 只 需要 知道 服务 器 的 地 址 ， 直 接 向 其 发 送 数据 。 | 喜 户 名 地 址 127.8.9.1:61989。 

即 可 。 它 只 包含 三 个 步骤 : 创建 套 接 字 、 接 收 (发送 ) 数据 、 关 999; 
闭 套 接 字 ， 详 细 代码 如 例 19-4 所 示 。 

【 例 19-4】 基 于 UDP 的 客户 端 程序 。 

import socket 

5 = socket.socket (socket .AF_INET, socket .SOCK DGRAM) 


S| 


# 定 义 socket 类 型 ,网 络 通信 ,UDP FEY ED] 

for data in [b'A', b'B', b'c']: Pe py a 
s.sendto(data，('127.0.0.1'，2333)) # 发 送 数据 Hello, B! 
print (s.recv (1024) .decode ('utf-8')) # 接 收 ,并 解码 数据 et | 

s.close() 


本 例 中 ， 首 先 创建 套 接 字 ， 在 创建 时 传 入 参数 来 设置 协议 类 
型 为 UDP， 然 后 向 服务 器 端 发 送 数据 。 发 送 完 数据 后 ， 再 从 服务 
器 端 接 收 相应 数据 。 两 段 程 序 的 测试 运行 结果 如 图 19-2 所 示 。 


19.2.4 用 SocketServer 模块 建立 服务 器 19-2 UDP 服务 器 端 和 客户 端 通信 测试 
Python 中 网 络 编程 除了 socket 模块 还 提供 了 SocketServer 模块 ， 主 要 实现 服务 器 端 程序 的 相关 功能 ， 


其 中 主要 对 socket 的 各 个 通用 过 程 进行 了 封装 ， 将 socket 对 象 的 创建 、 绑 定 、 连 接 、 接 收 或 发 送 、 关 闭 的 
过 程 都 封装 在 了 一 起 ， 很 大 程度 上 简化 了 二 次 编程 的 难度 。 
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SocketServer 模块 将 处 理 和 请 求 划分 为 两 部 分 , 分 别 是 服务 器 类 和 请 求 处 理 类 , 服务 器 类 处 理 通信 问题 ， 
请 求 处 理 类 处 理 数据 交换 或 传送 .SocketServer 模块 提供 了 两 个 主要 的 服务 器 类 , 用 于 创建 相应 的 套 接 字 流 ， 
分 别 为 TCPServer 和 UDPServer, 前 者 是 针对 TCP 流 式 套 接 字 ， 后 者 是 针对 UDP 数据 报 套 接 字 。 另 外 还 有 
两 个 不 是 很 常用 的 服务 器 类 : UnixStreamServer 和 UnixDatagramServer。 

有 了 服务 器 类 ， 还 需要 一 个 请 求 处 理 类 。 SocketServer 模块 提供 的 用 于 请 求 处 理 的 基 类 是 
BaseRequestHandler, 一 般 需 要 重 写 其 中 的 handle 方法 , 在 这 个 类 里 主要 有 三 个 方法 , 分 别 为 setup、handle 
和 finish 方法 。 在 调用 这 个 类 时 ， 先 调用 setup 方法 进行 请 求 处 理 的 初始 化 工作 ， 然 后 调用 handle 方法 进 
行 处 理工 作 〈 解 析 请 求 、 处 理 数据 、 发 出 响应 )， 最 后 调用 finish 方法 请 求 处 理 器 清理 相关 数据 。 这 里 最 
主要 的 参数 是 self.request， 也 就 是 请 求 的 socket 对象， 其 中 可 以 使 用 sendall 或 者 send 发 送 消息 、recv 接 
收 消息 。 

请 求 处 理 类 的 派生 类 有 两 个 ， 分 别 为 StreamRequestHandler (基于 TCP) 和 和 DatagramRequestHandler 
(基于 UDP)。 在 这 里 重 写 了 基 类 的 setup 方法 和 finish 方法 ，handle 方法 没有 重 写 ， 因 为 这 个 是 留 给 用 户 做 
处 理 的 方法 。 这 里 有 两 个 参数 ，selfrfile 用 来 读 取 数 据 的 句柄 ，selfwfile 用 来 发 送 消息 的 句柄 。 当 我 们 需要 
自己 编写 SocketServer 程序 时 , 只 需要 合理 选择 StreamRequestHandler 和 DatagramRequestHandler 之 中 的 一 
个 作为 父 类 ， 然 后 自 定义 一 个 请 求 处 理 类 ， 并 在 其 中 重 写 handle 方法 即 可 。 

用 SocketServer 创建 一 个 服务 器 有 几 个 基本 步骤 , 首先 需要 创建 一 个 请 求 处 理 类 , 合理 选择 StreamRequest 
Handler 和 DatagramRequestHandler 之 中 的 一 个 作为 父 类 (使 用 BaseRequestHandler 作为 父 类 也 可 以 )， 并 
重 写 它 的 handle 方法 。 然 后 实例 化 一 个 server class 对 象 ， 并 将 服务 的 地 址 和 之 前 创建 的 request handle class 
传递 给 它 。 最 后 调用 server class 对 象 的 handlerequest 或 serveforever 方法 来 开始 处 理 请 求 。 

使 用 socketserver 编写 基于 TCP 的 服务 器 端 代码 ， 详 细 代 码 如 例 19-5 所 示 。 

【 例 19-5】 使 用 SocketServer 编写 基于 TCP 的 服务 器 端 代码 。 


import socketserver 


class MyTCPHandler (socketserver.BaseRequestHandler): # 消 息 处 理 类 
def handle(self) : 
self.data = self.request.recv(1024) .strip () # 接 收 消息 


Print (" 收 到 : ",self.data) 
self.request.sendall ("你 好 ! %s".encode() % self.data)  ”# 返 回 消息 


if name ==" main _": 


HOST = ,127.0.0.1， 

PORT = 23333 

5 = socketserver.TCPServer( (HOST, PORT), MyTCPHandler) # 建 立 服务 器 

s.serve_forever() # 运 行 服务 器 
本 例 中 声明 了 MyTCPHandler 类 来 处 理 消息 ， 在 类 中 重 写 handle 方法 ， 让 其 在 接收 到 消息 后 ， 对 消息 进 

行 加 工 并 返回 , 通过 调用 TCPServer 方法 来 建立 一 个 服务 器 ， 并 通过 serve_forever 方法 使 服务 器 不 停 地 运行 。 

配合 使 用 的 客户 端 代 码 依旧 使 用 socket 模块 编写 ， 详 细 代 码 如 例 19-6 所 示 。 
【 例 19-6】 配 套 客户 端 代码 。 


import socket 


HOST = *127.0.0.1°' 
PORT = 23333 
data = "Tom" 


5 = socket.socket (socket.AF INET, socket.SOCK STREAM) ## 建 立 套 接 字 
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5.connect ((HOST, PORT)) 


s.sendall (data.encode()) 所 发 送 消息 td 了 
received = s.recv(1024) -decode () ”4# 接 收 消息 1 

s.close() 

print ("发 出 : {}".format (data) ) 手打 印 消息 


print (" 收 到 : {}".format (received)) 
程序 运行 结果 如 图 19-3 所 示 。 


eoe ED 

DesktopSpython3 client.py 
: Tom 

收 到 : 你 好 ! Tom 

Desktops 


图 19-3 使 用 SocketServer 做 服务 器 端 实 现 的 运行 结果 


19.3 urllib 与 http 包 的 使 用 
本 节 主 要 讲解 urllib 和 http 以 及 用 它们 访问 网 站 。 
19.3.1 urllib 和 http 包 简介 
urllib 是 Python 标准 库 最 为 常用 的 一 个 Python 网 络 应 用 资源 访问 的 模块 ， 它 可 以 让 用 户 像 访问 本 地 文 


本 文件 一 样 ， 读 取 网 页 的 内 容 。urllib 的 主要 作用 就 是 访问 一 些 静 态 的 、 不 需要 验证 的 网 络 资源 ， 就 像 浏 览 
器 一 样 ， 只 不 过 没有 传统 的 图 形 化 界面 。urllib 模块 包含 4 个 常用 的 子 模块 ， 如 表 19-5 所 示 。 


表 19-5 urllib 子 模块 


urllib.request 用 于 打开 和 读 取 URL 页 面 
urllib.error 定义 常见 的 urllib.request 引发 的 异常 
urllib.parse | 解析 URL 


http 模块 提供 了 使 用 HTTP 的 一 些 功能 。http 模块 包含 4 个 子 模块 ， 子 模块 列表 及 解释 如 表 19-6 所 示 。 


表 19-6 http 包子 模块 


解释 
低级 别 的 HTTP 客户 端 ， 高 级 别 的 URL 打开 使 用 urllib.request 
提供 了 基于 SocketServer 模块 的 基本 HTTP 服务 器 类 


模块 名 称 


cookies 实现 状态 管理 的 工具 
cookiejar 提供 cookies 的 持久 化 服务 
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http.cliet 模块 定义 了 实现 HTTP 和 HTTPS 客户 端的 类 。 但 是 它 通常 不 直接 使 用 ， 而 是 用 封装 好 的 
urllibrequest 模块 来 使 用 它们 处 理 URL。 一般 不 直接 使 用 http.client 模块 访问 HITP 服务 器 ， 建 议 使 用 
urllib.request 模块 。 


19.3.2 用 urllib 和 http 包 访问 网 站 


urllib.request 模块 主要 用 来 通过 URL 获取 并 展示 页 面 ,可 以 通过 使 用 request 模块 中 的 urlopen0 函 数 来 
访问 一 个 URL， 其 函数 原型 如 下 所 示 。 
urllib.request.urlopen (url, data=None) 


urlopen0 函 数 的 参数 列表 及 解释 如 表 19-7 所 示 。 
表 19-7 urlopen() 函 数 的 参数 列表 


要 进行 操作 的 URL 地 址 ， 可 以 为 字符 串 或 urlopen 对 象 


向 服务 器 传送 的 数据 


这 里 的 data 是 一 个 可 选 参数 ， 有 些 URL 网 站 在 访问 时 ， 需 要 向 其 传递 一 些 参数 ,来 定向 地 获取 我 们 想 
要 得 到 的 信息 ,这 个 时 候 就 可 以 使 用 data 参数 来 向 服务 器 传递 特定 的 数据 。url 就 是 平时 在 浏览 器 中 填 入 的 
网 址 ， 它 会 被 DNS 服务 器 解析 为 IP 地 址 ， 从 而 找到 相应 的 服务 器 主机 。 

下 面 通过 一 个 简单 的 例子 来 演示 通过 urlopen 访问 一 个 网 页 的 全 部 过 程 ， 详 细 代码 如 例 19-7 所 示 。 

【 例 19-7】 使 用 urlopen 获取 网 页 。 


>>> import urllib.request 
>>> urllib.request.urlopen ("https://www.baidu.com") .read() 


本 例 中 ， 首 先导 入 urllib 包 的 request 模块 ， 然 后 通过 调用 request 模块 的 urlopen 方法 ， 打 开 百 度 的 页 
面 ， 因 为 在 打开 百度 的 页 面 时 不 需要 传 入 任何 参数 ， 所 以 这 里 的 data 没有 传 参 ， 最 后 通过 read 读 取 获取 到 
的 百度 首页 的 页 面 信息 并 打印 在 终端 上 。 结 果 如 图 19-4 所 示 。 
eae 终端 


Python 3.6.5 |Anaconda, Inc.| (default，Apr 2618 
2018, 38:42:37) 


[GCC 4.2.1 Compatible Clang 4.9.1 (tags/RELEAS 
E_401/final)] on carwin 

Type "help", "copyright", "credits" or "licens 
e" for nore information. 

>>> import urllib.request 

>>> urllit.request.urlosen("https://www.baidu. 
cem") .reac() 
b'<himl>\r\n<head>\r\n\t<script>\r\n\t\tlocati 
or.replace(locaticn.href.repiace( "https://","h 
ttp://"));\r\in\t</script>\r\n</head>\r\n<body> 
\r\n\t<noscript><meta http-equiv="refresh" con 
tent="8iurl=htto://www.oaidu.con/"></noscript> 
\r\n¢/body>\r\n</htmi>" 

>>> 


图 19-4 使 用 urlopen 获取 页 面 结果 


使 用 urlopen 获取 页 面 后 ， 会 返回 一 个 相应 的 页 面 对 象 ， 包 含 很 多 属性 ， 也 有 一 些 常用 的 方法 ，read 就 
是 其 中 之 一 ， 用 来 读 取 网 页 的 页 面 正文 部 分 ， 其 他 常用 的 方法 如 表 19-8 所 示 。 
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a 
表 19-8 urlopen() 返 回 对 象 的 常用 方法 

方法 名 作 用 

read 读 取 获取 到 的 页 面 正文 

readline 从 页 面 正文 中 读 取 一 行 

close 关闭 页 面 对 象 

各 侈 返回 一 个 HTTPMessage 对 象 ， 显 示 头 部 信息 

getcode 返回 http 请 求 状态 码 

geturl 返回 请 求 的 url 地 址 
接 下 来 可 以 使 用 一 个 例子 对 这 些 常 用 方法 有 一 个 初步 的 


认识 ， 详 细 代码 如 例 19-8 所 示 。 
【 例 19-8】 常 用 函数 举例 。 
import urllib.request 
py = urllib.request.urlopen('http://www.baidu.com') 
print (py.info()) # 输 出 头 部 
print (py.getcode())  ”# 状 态 码 
print (py.geturl ()) # 输 出 url 地 址 
py.close() #4 关闭 对 象 


本 例 中 ， 首 先 打开 百度 的 页 面 ， 然 后 通过 info0 函 数 来 输 
出 头 部 信息 ， 之 后 使 用 getcode0 函 数 来 获取 请 求 的 状态 码 ， 如 
果 状 态 码 是 200 的 话 ， 证 明成 功 地 获取 到 了 网 页 了 ， 然 后 通过 
geturl0 函 数 来 获得 我 们 访问 的 网 页 的 url， 最 后 通过 close0 函 
数 来 关闭 页 面 对 象 ， 程 序 运 行 结果 如 图 19-5 所 示 。 

可 以 看 到 我 们 通过 info0 函 数 打印 出 了 完整 的 头 部 信息 ， 
包括 页 面 类 型 、 服 务 器 类 型 、 访 问 时 间 、 域 名 、cookies 等 信息 。 
如 果 使 用 浏览 器 并 打开 开发 者 工具 ,会 发 现 这 里 的 头 部 和 直接 
通过 浏览 器 访问 网 页 是 相同 的 。 只 不 过 通过 程序 访问 网 站 看 不 
到 图 形 界 面 而 已 。 


Ls) 余 庙 
DesktopSpython3 oupy 
Bdpagetype: 1 
Bdqio: gxf2sd5b89900136fo 
Coche-Control: private 
Content-Type: text/htal 
: baidu+2d5beleebc26e9381569ef57c8fc7b5b 
18 Jan 2019 95:14:81 GMT 
Fri, 48 Jan 2919 66:13325 OMT 
OTI DSP COR IVA OUR IND COM " 
WS/1.1 
BAIDUID=2791C6D495691DA935382CEBBDA 
1 expires=Thu，31-Dec-37 23:55: 


PSTM=1547788441; expires=Thu, 31-De 
5 GMT; max-age=2167483647; path=/? 


1 donoin=.beidu, com 


Pp: 1662_21900_28329.2 
B12 3635028566-221681 peth=7; dren bad-e 
om 

Vary: hecept-Encoding 

X-Ua-Conpatible: IE=Edgerchrone=l 

Connection: close 

Transfer-Encoding: chunked 
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19-5 ”requset 常用 函数 运行 结果 


如 果 想 要 向 网 站 传递 参数 的 话 ， 首 先 可 以 用 urllib 的 parse 子 模块 对 数据 进行 加 工 ， 其 中 ，urlencode() 
函数 可 以 将 常用 的 字典 形式 的 数据 转换 为 url 中 可 以 使 用 的 字符 串 ， 从 而 不 用 手动 将 数据 连接 成 字符 串 了 ， 


其 函数 原型 为 : 


urllib.parse.urlencode (query, doseq=False, safe=’' ,encoding=None, errors=None, quote via=quote_ 


plus) 


urlencode0 函 数 的 参数 列表 及 解释 如 表 19-9 所 示 。 


表 19-9 urlencode() 函 数 的 参数 列表 


参 数 解 释 
query 要 进行 编码 的 变量 和 值 组 成 的 字典 
doseq | 如 果 字 典 的 某 个 值 是 序列 的 话 是 否 解 析 ， 若 为 True 则 解析 ， 若 为 False 则 不 解析 
safe | 那些 字符 串 不 需要 编码 
encoding 要 转换 成 的 字符 串 的 编码 
quote_via 使 用 quote 编码 还 是 quoteplus 编码 ， 默 认为 quoteplus 
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可 以 将 数据 用 平常 的 键 值 对 的 方式 来 保存 ， 至 于 复杂 的 将 数据 编码 为 字符 串 的 任务 就 全 部 交 给 
urlencode0 函 数 来 解决 就 可 以 了 。 除 了 很 简单 的 传递 数据 以 外 ， 还 可 以 进行 一 些 更 加 复杂 的 操作 ， 有 些 网 站 
出 于 安全 等 的 考虑 ， 或 者 根据 头 部 的 不 同 会 发 送 不 同 的 页 面 ， 这 时 候 ， 如 果 想 要 获得 我 们 想 要 得 到 的 页 面 ， 
就 不 能 再 使 用 默认 的 请 求 头 部 了 ， 就 需要 对 请 求 的 头 部 进行 修改 了 。 

在 urllib 模块 中 可 以 通过 构造 Request 对 象 的 方法 来 创建 自 定 义 的 请 求 ， 从 而 对 头 部 、 数 据 等 信息 进行 
个 性 化 的 定制 。 其 函数 原型 如 下 所 示 。 

urllib.request.Request (url, data=None, headers={}) 


Request0 函 数 的 参数 列表 及 解释 如 表 19-10 所 示 。 


表 19-10 “Request() 函 数 的 参数 列表 


字符 串 ， 可 选 参数 


向 服务 器 传送 的 数据 ， 可 选 参数 
字典 ， 传 递 的 headers 数据 


在 建立 好 Request 对 象 后 还 可 以 访问 一 些 该 对 象 常用 的 属性 和 方法 ， 属 性 和 方法 列表 及 解释 如 表 
19-11 所 示 。 


表 19-11 Request 对 象 的 属性 和 方法 


属性 及 方法 解释 
full_url 将 原始 URL 传递 给 构造 函数 
host 主机 和 端 号 
originreqhost 发 出 请 求 的 原始 主机 名 
selector URL 路 径 ， 如 果 Requset 使 用 一 个 代理 ， 当 它 传递 给 代理 后 ， 选 择 器 将 会 是 完整 的 URL 
data 向 服务 器 传送 的 数据 ， 如 果 没有 指定 就 是 None 
method 使 用 HTTP 请 求 方法 ， 默 认 情况 下 它 的 值 是 None 
add_header(key.,val) 添加 向 服务 器 传送 的 header 中 的 数据 


下 面 通过 一 个 Request 对 象 使 用 实例 来 对 上 面 提 到 的 常用 属性 和 方法 做 进一步 的 了 解 , 详 细 代码 如 例 19-9 
所 示 。 
【 例 19-9】Request 对 象 使 用 实例 。 


import urllib.request 


url = "http://www.baidu.com' 

query = {'wd':'world'} # 要 查询 关键 词 数据 

data = urllib.parse.urlencode (query) 

data = data.encode (encoding="'UTF8') 

headers={'User-Agent':r'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML, like 
Gecko) '} #0ser-Agent 可 以 携带 浏览 器 名 、 版 本 号 、 操 作 系统 名 、 默 认 语 言 等 信息 


req = urllib.request.Request (url, data, headers) ## 创 建 Request 对 象 
Print('Eull url:', req.full url) # 原 始 URL 

print ('Host:', req.host) 才 主 机 和 端口 号 
print('Data:'，Treq.data) 给 向 服务 器 传送 的 数据 
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本 例 中 通过 访问 百度 URL 的 同时 传递 参数 来 实现 对 某 一 


特定 关键 词 进行 搜索 的 目的 。 首 先 将 搜索 时 用 到 的 关键 词 数据 ”| 二 全 全 5 = 


DesktopSpython3 a.py 


用 字典 格式 打包 , 然后 使 用 parse 子 模块 的 urlencodeO 函 数 将 其 Full url: http://www.baidu.com 


Host: www.baidu.com 


编码 为 字符 串 ， 并 设置 该 字符 串 的 编码 为 UTF-8 保证 传输 过 程 ” Be: 


中 字符 串 的 值 不 会 发 生变 化 ,然后 给 request 自 定义 一 个 header， 
最 后 通过 Request0 函 数 和 刚才 准备 好 的 数据 来 构建 一 个 请 求 。 
最 后 通过 访问 follL_url、host、data 等 属性 将 打印 在 桌面 上 ， 结 


果 如 


访问 


Desktop: 


图 19-6 所 示 。 
除了 使 用 urllib 模块 来 访问 网 站 外 , 也 可 以 使 用 http 模块 来 
站 ，http.client 使 用 HTTPConnection0 函 数 来 构建 一 个 基 19-6 ”Request 对 象 实例 结果 


本 的 连接 ， 其 函数 原型 如 下 所 示 。 


http.client.HTTPConnection (host, port=None, [timeout, ] source address=None) 


HTTPConnection() 函 数 的 参数 列表 及 解释 如 表 19-12 所 示 。 
表 19-12 HTTPConnection() 函 数 的 参数 列表 


参数 解释 
host 服务 器 地 址 
port 提供 的 端口 号 ， 不 提供 则 从 host 中 提取 ， 否 则 使 用 默认 的 80 端口 
timeout 若 给 定 参数 ， 阻 塞 操作 会 在 给 定 的 时 间 后 超时 ， 未 给 定 ， 则 使 用 默认 的 全 局 timeout 设置 
Source _address 以 host 和 port 的 元 组 形式 ， 作 为 HTTP 连接 的 源 地 址 


法 来 
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这 里 举 一 个 使 用 http 模块 访问 网 站 的 实际 例子 ， 详 细 代码 如 例 19-10 所 示 。 
【 例 19-10】 使 用 http 模块 访问 网 站 。 


import http.client 


conn= http.client.HTTPConnection('www.baidu.com') 

conn.request ('GET', '/') 

res=conn.getresponse () # 获 得 响应 正文 

Print (res.read() .decode ('utf-8')) 

本 例 中 首先 创建 了 一 个 http 连接 ， 然 后 通过 request0 函 数 来 请 求 页 面 ， 得 到 页 面 后 通过 getresponse 方 
获得 响应 正文 ， 最 后 再 对 正文 进行 解码 输出 ， 结 果 如 图 19-7 所 示 。 


/htels cnarsot=stf-8"> 
oe"> 


19-7 使 用 http 模块 访问 网 站 结果 
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这 里 通过 getresponse0 函 数 会 得 到 一 个 HttpResonse 对 象 ， 这 个 对 象 有 一 些 常用 的 基本 属性 和 方法 。 
HttpResponse 对 象 的 属性 和 方法 列表 及 解释 如 表 19-13 所 示 。 


表 19-13 HttpResponse 对 象 的 属性 及 方法 


属性 及 方法 解 释 
read([amt]) 读 取 和 返回 response 的 body 部 分 
读 取 指定 的 字 节 长 度 len(b)， 并 返回 到 缓冲 字 节 b。 函 数 返回 读 取 的 字 节 数 
getheader(name.default=None) 获得 服务 器 响应 的 HTTP 头 ，name 表示 指定 HTTP 头 名 
getheaders() | 以 元 组 的 形式 返回 所 有 的 头 部 信息 (headervalue) 
version | HTTP 版 本 


status HTTP 状态 码 


下 面 通过 一 个 例子 来 对 上 面 提 到 的 属性 和 方法 进一步 了 解 ， 详 细 代 码 如 例 19-11 所 示 。 
【 例 19-11】HttpResponse 常用 方法 属性 实例 。 


import http.client 


conn = http.client.HTTPSConnection ("www.baidu.com") 
conn ,request ('GET', '/') 

res = conn.getresponse () 

print (res.getheader('Date')) +#+ 从 头 部 获得 日 期 信息 
print (res.version) 

print (res.status, res.reason) 


本 例 中 尝试 了 HttpResponse 对 象 常用 的 不 同方 法 和 属性 ， 在 编程 时 可 以 根据 需要 选择 不 同 的 属性 或 函 
数 使 用 ， 结 果 如 图 19-8 所 示 。 


eoe 终端 

DesktopSpython3 a. 口 
Fri, 18 Jan 2619 7 16:19 GMT 

11 

268 OK 

DesktopS 


19-8 HttpResponse 常用 属性 实例 结果 


19.4 用 poplib 与 smtplib 库 收 发 邮件 


电子 邮件 是 在 网 络 编程 中 很 常见 的 一 种 应 用 场景 ， 通 常情 况 下 我 们 都 是 在 网 页 或 者 不 同 的 邮件 客户 
端 中 编写 邮件 并 发 送 的 。 但 是 在 本 节 中 , 将 学 习 使 用 Python 来 完成 邮件 的 接收 和 发 送 。 我 们 会 使 用 poplib 
模块 来 接收 和 处 理 使 用 POP3 协议 的 邮件 ， 并 学 习 使 用 smtplib 模块 发 送 SSL/TLS 安全 邮件 的 方法 。 
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19.4.1 用 poplib 


可 以 使 用 poplib 模块 


on 从 入 门 到 项 目 实 路 ( 超 信 版) 


检查 邮件 


使 用 这 个 对 象 来 连接 到 POP3 服务 器 ， 


的 POP3 类 来 创建 一 个 对 象 , 并 


Ppoplib.POP3 (host,port[vtimeout]) 


POP30 函 数 的 参数 列 


表 及 解释 如 表 19-14 所 示 。 
表 19-14 POP3() 函 数 的 参数 列表 


数 


host 


解释 
POP3 服务 器 地 址 


port 


| 端口 号 ,默认 为 110， 可 选 参 数 


timeout 超时 时 间 


在 构造 好 POP3 对 象 后 ,就 可 以 使 用 该 对 象 所 封装 的 一 些 属性 和 方法 了 。POP3 对 象 的 常用 方法 列表 如 


表 19-15 所 示 。 


广州 法 描述 


user(uesrname) 
pass_(password) 
apop(Name.Digest) 
statO 

getwelcome() 
list(which) 
uidl(which=None) 
retr(which) 
dele(which) 

rset() 

noopO 
top(which.howmuch) 
quitO 


表 19-15 POP3 对 象 的 常用 方法 


用 户 名 ， 相 应 需要 密码 ， 就 是 下 面 的 pass_ 命 令 ， 若 两 者 都 成 功 则 状态 将 转换 
用 户 密码 

Digest 是 MD5 
返回 邮箱 状态 ， 
返回 欢迎 信息 
获得 邮件 内 容 列 表 

返回 邮件 摘要 列表 

获取 指定 邮件 ， 并 设置 其 状态 为 已 读 

设置 删除 邮件 标记 ， 调 用 quitO 时 执行 删除 邮件 操作 

清除 邮件 删除 标记 

服务 器 返回 一 个 肯定 的 响应 

返回 由 参数 标识 的 邮件 前 howmuch 行内 容 ，howmuch 必 为 整数 
退出 ， 释 放 连 接 


息 摘要 
结果 为 元 组 (message countmailbox size) 


POP3 协议 用 于 邮件 的 接收 ， 一 个 使 用 POP3 检查 接收 到 的 邮件 的 例子 如 例 19-12 所 示 。 
【 例 19-12】 使 用 POP 检查 邮件 。 
import getpass,poplib 


host = '" #POP3 服务 器 的 主机 名 

port = 110 #POP3 服务 器 端口 号 默认 为 110 
pop3 = poplib.POP3 (host,port) # 创 建 POP3 对 象 

username = '" # 用 于 登录 

password = '" 

print (pop3.getwelcome () .decode ('utf8')) # 进 行 身份 验证 
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pop3.user (username) 
pop3.pass_ (password) 


num = len(pop3.1ist()) # 邮 件数 
for i in rece(num): 4# 接 收 邮件 
for j in pop3.retr(i+1): 
print (j) # 检 查 并 显示 邮件 


本 例 中 ， 首 先 对 基本 属性 进行 设置 ， 然 后 创建 一 个 pop3 对 象 ， 之 后 根据 个 人 信息 填写 用 户 名 和 密码 ， 
然后 连接 邮件 服务 器 进行 身份 认证 。 这 里 如 果 验 证 成 功 的 话 会 返回 相应 的 信息 ， 之 后 就 可 以 读 取 邮 件 了 。 
通过 查询 邮件 列表 ， 就 可 以 遍历 其 中 的 每 一 封 邮件 ， 并 将 其 打印 在 桌面 上 ， 这 里 没有 实际 的 邮件 服务 器 ， 
所 以 就 不 进行 验证 了 ， 有 条 件 的 读者 可 以 实际 连接 服务 器 试 一 试 。 


19.4.2 用 smtplib 发 送 邮 件 


除了 对 邮箱 里 收 到 的 邮件 进行 检查 ， 也 可 以 通过 Python 来 发 送 邮 件 。SMTP (Simple Mail Transfer 
Protocol， 简 单 邮件 传输 协议 ) 是 一 组 用 于 由 源 地 址 到 目的 地 址 传送 邮件 的 规则 ， 由 它 来 控制 信件 的 中 转 方 
式 。 这 里 就 用 到 了 Python 的 smtplib 模块 。smtplib 模块 提供 了 一 种 很 方便 的 途径 ， 让 用 户 只 编写 少量 的 代 
码 就 可 以 发 送 电 子 邮 件 ， 在 日 常 编程 中 可 以 处 理 一 些 发 送 、 抄 送 、 下 载 邮件 内 容 等 操作 。 

poplib 模块 中 的 SMTP 对 象 用 于 设 定 由 源 地 址 到 目的 地 址 传送 邮件 的 规则 ， 由 它 来 控制 信件 的 中 转 方 
式 。 其 构造 函数 原型 为 : 

smtplib.sMTP (host, port, local hostname=None,timeout) 


SMTPO 函 数 的 参数 列表 及 解释 如 表 19-16 所 示 。 


表 19-16 ”SMTP() 函 数 的 参数 列表 


参 数 解释 
host 服务 器 
port 端口 号 ， 一 般 情况 下 SMTP 端口 号 为 25 
local_hostname 本 地 主机 
timeout 超时 时 间 


使 用 SMTPO 函 数 构建 SMTP 对 象 后 ， 就 可 以 使 用 SMTP 对 象 的 基本 方法 了 ， 通 过 这 些 方法 就 可 以 使 
用 很 少量 的 代码 完成 邮件 的 认证 、 发 送 等 行为 。SMTP 对 象 的 常用 方法 如 表 19-17 所 示 。 


表 19-17 SMTP 对 象 的 常用 方法 


连接 远程 SMTP 主机 
远程 SMTP 主机 的 校 验 ， 登 录 到 服务 器 
发 送 邮 件 


connect(host.port) 


login(user.password) 


sendmail(fromaddr.toaddrs.msg.mailoptions.rcptoptions) 


starttls(keyfile.certfile) 启用 TLS (安全 传输 ) 模式 
quitO 断 开 SMTP 服务 器 的 连接 
docmd(cmd.args) 发 送 命令 到 服务 器 


其 中 需要 详细 讲解 的 是 sendmail 这 个 函数 ， 通 过 这 个 函数 可 以 向 邮件 服务 器 发 送 邮件 。 其 中 ， 参 数 
fromaddr 代表 邮件 发 送 者 的 地 址 ， 参 数 toaddrs 代表 邮件 要 送 达 的 目的 地 地 址 ， 参 数 msg 代表 要 发 送 消息 。 
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要 注意 的 是 msg 是 字符 串 ， 表 示 邮 件 。 邮 件 一 般 由 标题 、 发 信人 、 收 件 人 、 邮 件 内 容 、 附 件 等 构成 ， 发 送 


邮件 的 时 候 ， 


要 注意 msg 的 格式 。 这 个 格式 就 是 SMTP 中 定义 的 格式 。 


一 个 具体 的 使 用 SMTP 对 象 进行 邮件 发 送 的 实例 如 例 19-13 所 示 。 


【 例 19-1 


3】 使 用 SMTP 发 送 邮 件 。 


#!/usr/bin/python 
dln VTE = 


import smtplib 
from email.mime.text import MIMEText 
from email.header import Header 


# 第 三 方 SMTP 服务 
mail_host="smtp.XXX.com" ## 设 置 服务 器 
mail user="XXXX" 攻 用 户 名 
mail pass="XXXXXX" 4# 密 码 
sender = 'XXX@XXX.com' # 发 送 人 


receivers = ['XXXXXX@qq.com'] 直接 收 人 ,可 设置 为 你 的 QQ 邮箱 或 者 其 他 邮箱 


message 


= MIMEText ('SMTP 邮件 发 送 测试 ...'，'plain'，"'utf-8') # 设 置 消息 格式 


message['From'] = Header ("XXXXX", 'utf-8') 
message['To'] = Header ("XXXX", 'utf-8') 


subject 
message[ 


try: 


= "Python SMTP 邮件 测试 ' 
"Subject'] = Header(subject, ‘'utf-8') 


smtpobj = smtplib.SMTP() 
smtpobj .connect (mail host, 25) #425 为 SMTP 端口 号 
smtpobj .login (mail user,mail pass) 
smtpobj .sendmail (sender, receivers, message.as_ string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SsMTPException: 
print ("Error: 无 法 发 送 邮件 ") 


本 例 中 ， 


首先 对 一 些 基本 的 信息 进行 了 配置 ， 指 定 了 邮件 的 服务 器 、 用 户 名 、 密 码 、 发 送 人 、 接 收入 ， 


通过 email 模块 中 设 定好 的 邮件 格式 对 消息 进行 填充 ， 之 后 只 需要 向 其 中 的 不 同 参数 传 入 想 要 传 入 的 值 就 


FTP 是 用 


层 。FTP 在 网 


件 就 有 些 显得 


可 以 了 。 最 后 通过 SMTP 函数 创建 一 个 SMTP 对 象 ， 首 先 调用 connect0 函 数 连接 服务 器 ， 然 后 调用 login0 
函数 登录 ， 然 后 调用 sendemail0 函 数 发 送 邮 件 ， 由 于 刚才 直接 使 用 了 固定 的 邮件 格式 模板 ， 所 以 这 里 就 减 
少 了 处 理 字 符 串 格式 的 问题 ， 代 码 量 和 出 错 的 可 能 性 都 降低 了 很 多 。 同 样 ， 本 代码 仅 供 参考 ， 有 条 件 的 话 
可 以 填写 代码 中 “XXX” 对 应 的 参数 ， 在 自己 的 计算 机 上 进行 测试 。 


19.5 用 ftplib 访问 FTP 服务 


于 在 网 络 上 进行 文件 传输 的 一 套 标 准 协议 ， 使 用 客户 端 /服务 器 模式 。 它 属于 网 络 传输 协议 的 应 用 
络 编程 中 也 是 经 常 出 现 的 一 种 应 用 场景 ， 有 时 候 我 们 想 传输 一 些 大 型 的 文件 到 服务 器 ， 这 时 候 邮 
容量 太 小 了 ， 可 以 使 用 FTP 在 互联 网 中 来 传输 文件 。 


在 Python 中 可 以 使 用 ftplib 模块 来 快速 构建 一 个 对 远程 FTP 服务 器 的 连接 。 同样， 由 于 Python 库 强 大 
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的 功能 ， 只 需要 再 编写 少量 的 代码 ， 就 可 以 完成 文件 的 上 传 与 下 载 等 任务 。 


19.5.1 


ftplib 模块 简介 


可 以 使 用 ftplib 模块 中 的 FTPO 函 数 来 构造 一 个 基本 的 FTP 连接 对 象 ， 其 函数 原型 如 下 所 示 。 
ftplib.FTP (host="'',user='',password='',acct="'',timeout=None, source address=None) 


FTPO 函 数 的 参数 列表 及 解释 如 表 19-18 所 示 。 


表 19-18 FTP() 函 数 的 参数 列表 及 解释 


参 数 描 述 
host FTP 服务 器 
User 用 户 名 
password 登录 密码 
acct 账户 
timeout 超时 时 间 


source_address 


是 一 个 二 元 组 〈host，port)， 用 于 在 连接 之 前 将 要 绑 定 的 socket 


该 函数 会 返回 一 个 FTP 类 的 新 实例 。 我 们 就 可 以 使 用 FTP 对 象 的 基本 函数 来 对 远程 的 FTP 服务 器 发 出 
请 求 ， 上 传 或 者 下 载 文件 了 。FTP 对 象 的 常用 属性 和 方法 及 解释 如 表 19-19 所 示 。 


属性 及 方法 


set_debuglevel(level) 


表 19-19 FTP 对 象 的 常用 属性 及 方法 

描 述 
设置 调试 级 别 ，0 一 默认 值 ， 无 调试 信息 ，1 一 基本 调试 信息 ，2 以 上 一 详细 调试 
信息 


connect() 连接 到 FTP 服务 器 
login(user.password.acct) 登录 FTP 服务 器 
getwelcome() 欢迎 信息 
abort0) 终止 正在 进行 的 文件 传输 
sendcmd(cmd) 将 简单 的 命令 字符 串 发 送 到 服务 器 并 返回 响应 字符 串 
将 简单 的 命令 字符 串 发 送 到 服务 器 并 处 理 响 应 , 若 收 到 成 功 的 响应 代码 (200 一 299 
的 代码 ) 则 返回 任何 内 容 ， 否 则 提高 eror reply 
retrbinaryO 以 二 进 制 模式 下 载 文 件 
Tetrlines(cmd.callback=None) 以 文本 传输 模式 下 载 文件 
set_pasv(val) 若 val 为 Tme， 启 用 “被 动 ”模式 ， 否 则 禁止 ， 被 动 模式 默认 为 打开 状态 
storbinary() 以 二 进 制 传输 模式 存储 文件 
storlines(cmd.fp.callback=None) 以 文本 文件 传输 模式 存储 文件 
transfercmd(cmd.rest=None) 通过 数据 连接 启动 传输 
ntransfercemd(cmd.rest=None) 与 transfercmd0 类 似 ， 但 返回 数据 连接 的 元 组 和 数据 的 预期 大 小 
mlsd(path.facts) 使 用 MLSD 命令 (RFC 3659) 以 标准 格式 列 出 目录 
rename(fromname.toname) 文件 重 命名 
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SC 


删除 文件 


delete(filename) 


cwd(pathname) 切换 当前 目录 
mkd(pathname) 创建 目录 
pwdO 打印 当前 目录 
rmd(dimame) 删除 目录 
size(dimame) 获取 文件 大 小 
quit0) 退出 


close() 关闭 FTP 对象 


这 些 函数 不 需要 记忆 ， 可 以 根据 实际 编码 的 使 用 场景 来 适当 地 选择 。 可 以 看 出 ，ftplib 模块 几乎 把 平时 
可 能 会 使 用 到 的 功能 都 进行 了 不 同 程度 的 封装 ， 所 以 只 要 对 ftplib 库 熟悉 了 ， 就 可 以 轻松 地 使 用 Python 的 
FTP 服务 了 。 


19.5.2 ”使 用 Python 访问 FTP 


本 节 通 过 一 个 具体 的 例子 来 访问 远程 的 FTP 服务 器 。 通 过 使 用 FTP 对 象 的 常用 函数 ， 来 处 理 与 FTP 
服务 器 建立 连接 的 业务 流程 ， 并 把 这 些 流程 封装 成 实际 的 使 用 场景 ， 详 细 代码 如 例 19-14 所 示 。 
【 例 19-14】 使 用 Python 访问 FTP。 


from ftplib import FTP 


def ftpconnect (host, username, password): 


ftp = FTP() 
ftp.connect (host, 21) # 连 接 
ftp.1login(username，Ppassword) “4 登录 
return ftp 


def downloadfile (ftp, remotepath, localpath): 


bufsize = 1024 # 设 置 缓冲 块 大 小 

fp = open(localpath, 'wb') # 以 写 模式 在 本 地 打开 文件 

ftp.retrbinary('RETR ' + remotepath，fp.write，bufsize) # 接 收服 务 器 上 文件 并 写 入 本 地 文件 
fp.close() # 关 闭 文件 


def uploadfile (ftp, remotepath, localpath): 
bufsize = 1024 
fp = open(localpath, 'rb') 
ftp.storbinary('STOR '+ remotepath ，fp，bufsize) # 上 传 文件 
fp.close() 

Ne a MA 
ftp = ftpconnect ("tees 
downloadfile (ftp, "中 本 mn 本本 本) 
uploadfile (ftp, "“**#", "*##") 
ftp.quit () 


本 例 中 ， 通 过 函数 将 每 一 个 步骤 进行 了 封装 ， 来 处 理 不 同 的 过 程 ，ftpconnectO 函 数 主要 用 来 建立 FTP 
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连接 ， 返 回 fp 对 象 ， 在 其 中 调用 了 connect0 函 数 和 login0 函 数 来 连接 FTP 服务 器 。downloadfile0 函 数 用 
来 下 载 文 件 ， 在 获取 到 数据 后 ， 在 本 地 新 建 一 个 文件 并 向 文件 写 入 二 进 制 数据 。uploadfile0 函 数 用 来 上 传 
文件 ， 在 其 中 首先 使 用 open0 函 数 打开 文件 ， 然 后 使 用 storbinary0 函 数 来 上 传 二 进 制 文件 到 远程 服务 器 。 

最 后 在 执行 完 所 有 操作 之 后 ， 不 要 忘记 使 用 quitO 函 数 来 退出 FTP 连接 。 


19.6 ”就 业 面试 技巧 与 解析 


19.6.1 面试 技巧 与 解析 (一) 


面试 官 : 相 比 直接 使 用 socket 使 用 SocketServer 的 优势 是 什么 ? 

应 聘 者 : 虽说 用 Python 编写 简单 的 网 络 程序 很 方便 ， 但 复杂 一 点 儿 的 网 络 程 序 还 是 用 现成 的 框架 比较 
好 。 这样 就 可 以 专心 事务 逻辑 ,而 不 是 套 接 字 的 各 种 细节 。SocketServer 模块 简化 了 编写 网 络 服务 程序 的 任 
务 。 同 时 ，SocketServer 模块 也 是 Python 标准 库 中 很 多 服务 器 框架 的 基础 。 


19.6.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : Python 网 络 编程 都 有 哪些 常见 的 应 用 场景 ? 可 以 用 哪些 技术 实现 ? 

应 聘 者 : Python 网 络 编程 常见 的 应 用 场景 有 访问 网 站 、 发 送 邮件 、 使 用 FTP 发 送 文件 等 。 访 问 网 站 可 
以 使 用 urllib 模块 或 者 http 模块 来 实现 ,邮件 的 接收 可 以 使 用 poplib 模块 来 实现 ,邮件 的 发 送 可 以 使 用 smtplib 
模块 来 实现 ， 基 本 的 FTP 服务 可 以 使 用 ftplib 来 实现 。 
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> 学 习 指引 


Web 应 用 开发 可 以 说 是 目前 软件 开发 中 最 重要 的 部 分 。Web 开发 经 历 了 以 下 几 个 阶段 。 

静态 Web 页 面 : 由 文本 编辑 器 直接 编辑 并 生成 静态 的 HTML 页 面 ， 如 果 要 修改 Web 页 面 的 内 容 ， 就 
需要 再 次 编辑 HTML 源 文件 ， 早 期 的 互联 网 Web 页 面 就 是 静态 的 。 

CGI: 由 于 静态 Web 页 面 无 法 与 用 户 交互 , 例如 用 户 填写 了 一 个 注册 表单 , 静态 Web 页 面 就 无 法 处 理 。 
要 处 理 用 户 发 送 的 动态 数据 ， 出 现 了 Common Gateway Interface (CGI)， 用 C/C++ 编 写 。 

ASP/JSP/PHP: 由 于 Web 应 用 的 特点 是 修改 频繁 ， 用 C/C++ 这 样 的 低级 语言 非常 不 适合 Web 开发 ,而 
脚本 语言 由 于 开发 效率 高 ,与 HIML 结合 紧密 ， 因 此 迅速 取代 了 CGI 模式 。ASP 是 微软 推出 的 用 VBScript 
脚本 编程 的 Web 开发 技术 ， 而 JSP 用 Java 来 编写 脚本 ，PHP 本 身 则 是 开源 的 脚本 语言 。 

MVC: 为 了 解决 直接 用 脚本 语言 说 入 HTML 导致 的 可 维护 性 差 的 问题 ,Web 应 用 也 引入 了 Model-View- 
Controller 的 模式 ， 来 简化 Web 开发 。ASP 发 展 为 ASPNET，JSP 和 PHP 也 有 一 大 堆 MVC 框架 。 

目前 ，Web 开发 技术 仍 在 快速 发 展 中 ， 异 步 开 发 、 新 的 MVVM 前 端 技术 层出不穷 。 

Python 的 诞生 历史 比 Web 还 要 早 ， 由 于 Python 是 一 种 解释 型 的 脚本 语言 ， 开 发 效率 高 ， 所 以 非常 适 
合用 来 做 Web 开发 。 

Python 有 上 百 种 Web 开发 框架 ， 有 很 多 成 熟 的 模板 技术 ， 选 择 Python 开发 Web 应 用 ， 不 但 开发 效率 
高 ， 而 且 运 行 速度 快 。 

本 章 会 详细 讨论 Python Web 开发 技术 。 


二 重点 导读 


*Flask 介绍 与 安装 。 
。Flask 应 用 。 
。Diango 介绍 与 安装 。 
* Django 应 用 。 


20.1 Flask Web 网 站 框架 


20.1.1 ”Flask 框架 简介 
Flask 是 当下 流行 的 Web 框架 ， 基于 Python 实现 ， 是 一 种 轻 量 级 Web 应 用 框架 。 轻 量 级 意味 着 保持 核 
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心 的 简单 ， 但 同时 又 易于 扩展 。 在 默认 的 情况 下 ，Flask 不 包括 数据 库 抽 象 层 以 及 表单 验证 ， 或 是 其 他 库 已 
经 可 以 胜任 的 功能 ， 但 是 ，Flask 支持 用 扩展 来 给 应 用 添加 这 些 功能 。 正 是 这 项 特性 使 得 它 在 Web 开发 方 
特别 流行 ! 


20.1.2 ”Flask 框架 安装 


Flask 也 被 称 为 “microframework ”， 因 为 它 使 用 简单 的 核心 ， 用 extension 增加 了 其 他 功能 。Flask 没有 
默认 使 用 的 数据 库 、 窗 体验 证 工具 。 然 而 ，Flask 保留 了 扩 增 的 弹性 ， 可 以 用 Flask-extension 加 入 这 些 功 能 
ORM、 窗 体验 证 工具 、 文 件 上 传 、 各 种 开放 式 身份 验证 技术 。 

在 Windows 下 以 管理 员 身 份 运行 命令 提示 符 cmd， 执 行 以 下 命令 ， 可 安装 Flash。 

pip install Flask 

在 Linux 或 Mac 下 可 能 需要 使 用 以 下 命令 。 

sudo pip install Flask 

如 果 想 建立 一 个 工作 环境 与 外 界 不 会 冲突 , 那么 需要 先 建 立 一 个 虚拟 环境 , 这 个 环境 能 够 安装 所 有 
的 东西 ， 而 主 Python 不 会 受到 影响 。 另 外 一 个 好 处 就 是 这 种 方式 不 需要 拥有 root 权限 。 本 书 演示 的 环 
境 是 在 Windows 下 的 Python 3.6 下 ， 同 样 也 会 介绍 在 其 他 系统 的 安装 。 首 先 ， 创 建 一 个 文件 夹 ， 将 其 
命名 为 learnflask。 

python -m venv flask 

以 上 命令 在 leamflask 中 创建 了 一 个 名 为 flask 的 文件 夹 ， 其 中 创建 了 一 个 完整 的 Python 环境 。 如 果 使 
用 Python 3.4 以 下 的 版 本 (包括 Python 2.7)， 想 要 创建 虚拟 环境 需要 先 安装 virtualenv.py。 如 果 使 用 Mac OS 
X， 请 使 用 下 面 的 命令 行 安装 。 

sudo easy install virtualenv 

在 Windows 下 安装 virtualenv 很 简单 ， 利 用 pip 即 可 ， 如 下 所 示 。 

pip install virtualenv 

之 后 直接 使 用 virtualenv 文件 名 即 可 创建 一 个 环境 ， 如 下 所 示 。 

cd flask # 进 入 虚拟 环境 文件 夹 

cd Scripts ”上 # 进 入 相关 的 启动 文件 夹 

activate # 启 动 虚拟 环境 

deactivate ”# 关 闭 虚拟 环境 

如 果 是 在 Linux、Mac OS 义 或 者 Cygwin 上 ， 可 通过 一 个 接 一 个 输入 如 下 的 命令 行 来 安装 Flask 以 及 扩 
展 〈 包 括 以 后 会 用 到 的 库 )。 
flask/bin/pip install flask 
flask/bin/pip install flask-login 
flask/bin/pip install flask-openid 
flask/bin/pip install flask-mail 
flask/bin/pip install flask-sqlalchemy 
flask/bin/pip install sqlalchemy-migrate 
flask/bin/pip install flask-whooshalchemy 
flask/bin/pip install flask-wtf 
flask/bin/pip install flask-babel 
flask/bin/pip install guess language 
flask/bin/pip install flipflop 


WNWNWnnnnnn 
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$ flask/bin/pip install coverage 
如 果 是 在 Windows 上 ， 命 令 行 会 有 些 不 同 ， 如 下 所 示 。 
flask\scripts\pip install flask 
flask\scripts\pip install flask-login 
flask\scripts\pip install flask-openid 
flask\scripts\pip install flask-mail 
flask\scripts\pip install flask-sqlalchemy 
flask\scripts\pip install sqlalchemy-migrate 
flask\scripts\pip install flask-whooshalchemy 
flask\scripts\pip install flask-wtf 
flask\scripts\pip install flask-babel 
flask\scripts\pip install guess_language 
flask\scripts\pip install flipflop 
flask\scripts\pip install coverage 


20.1.3 ”Flask 框架 第 一 个 程序 “Hello world!” 


使 用 PyCharm 创建 一 个 工程 (项 目 名 最 好 不 要 用 中 文 ， 如 图 20-1 所 示 )， 代 码 如 下 。 
from flask import Flask #3 入 Flask 
app = Flask(_ name ) +# 创 建 一 个 Flask 实例 
Qapp. route('/') # 将 网 址 映射 到 这 个 函数 上 
def hello flask() : 
return 'Hello world!' 


WWNWNWNNWNNWNN 


if _name ==' main_': 


app.run () # 执 行程 序 


20-1 使 用 PyCharm 创建 工程 


这 里 要 注意 ， 如 果 环 境 是 在 Windows 下 ， 需 要 选 虚 拟 环境 下 的 Python， 这 里 选择 Add local (本 次 实例 
采用 的 是 Python 2.7.1)。 
创建 完成 后 ， 会 看 到 已 经 有 模板 了 ， 设 置 编码 方式 为 uttg， 如 图 20-2 所 示 。 
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图 20-2 PyCharm 默认 模板 


执行 一 下 这 个 模板 ， 可 以 看 到 结果 给 出 一 个 地 址 ， 将 其 复制 到 浏览 器 访问 ， 可 以 看 到 页 面 上 输出 了 
“Hello World!”， 如 图 20-3 所 示 。 


© 全 |0127001 
刘 应 用 周 玫 习 局 工作 


Hello World! 


图 20-3 执行 结果 


20.1.4 ”Flask 框架 的 基本 使 用 


1. 路 由 系统 

路 由 是 在 MVC 架构 下 的 Web 框架 中 的 一 个 很 重要 的 概念 。 路 由 表示 用 户 请 求 的 URL 找 出 其 对 应 的 
处 理 函 数 ， 在 Flask 中 route0 会 把 一 个 函数 绑 定 到 URL 上 。 

1) 动态 路 由 (URL 传递 参数 ) 

Qapp.route('/MyPage') 


def index(): 
return 'This is My Page!' 


这 样 访问 /index 时 页 面 就 会 显示 出 “This is My Page!” 的 字样 。 
还 可 以 通过 构建 路 由 传递 参数 ， 也 可 以 指定 参数 的 类 型 ， 采 用 规则 <converter:variable_name>: 
Converter (转换 器 ) : int 类 型 ，float 浮 点 数 ，path 和 默认 的 相似 但 接受 和 斜 线 
这 种 方式 将 username 直接 传递 给 函数 在 页 面 上 打印 出 来 。 
@app.route('/user/<int:id>') 
def show_id(id) : 
return "id type:'+type (id) 
2) 指定 请 求 方法 
Qapp.route('/login', methods=['GET', 'POST']) 
# 指 定 请 求 方法 


app=Flask(_ name ) 
@app.route('/<path:url>/',methods=['get']) # 只 允许 get 请 求 
def first flask(url): 

print (ur1) 
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3) 通过 别名 反 向 生成 URL 


4) 通过 app.add_url_rule() 方 法 调用 路 由 


5) 通过 扩展 路 由 功能 : 正则 匹配 URL 


2. 进行 请 求 处 理 
利用 request 进行 请 求 处 理 ， 代 码 如 下 。 


3. 视图 
给 Flask 视图 函数 加 装饰 器 ， 代 码 如 下 。 


1) 请 求 相 关 信 息 
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2) 响应 相关 信息 

returm "字符 串 " : 响应 字符 串 。 

return render_template(html 模板 路 径 ',**{})， 响 应 模板 。 
return redirect(Vindex.html): 跳 转 页 面 。 

Flask 之 CBV 视图 。 

具体 代码 如 下 。 
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在 网 站 中 ，http 请 求 是 无 状态 的 。 也 就 是 说 ， 即 使 第 一 次 和 服务 器 连接 后 并 且 登 录 成 功 后 ， 第 二 次 请 


求 服务 器 依然 不 能 知道 当前 请 求 是 哪个 用 户 。cookie 的 出 现 就 是 为 了 解决 这 个 问题 ， 第 一 次 登录 后 服务 器 
返 


返回 一 些 数据 (cookie) 给 浏览 器 ， 然 后 浏览 器 保存 在 本 地 ， 当 该 用 户 发 送 第 二 次 请 求 的 时 候 ， 就 会 自动 地 


把 上 次 请 求 存储 的 cookie 数据 携带 给 服务 器 ， 服 务 器 通过 浏览 器 携带 的 数据 就 能 浊 
cookie 存储 的 数据 量 有 限 ， 不 同 的 浏览 器 有 不 同 的 存储 大 小 ， 但 一 般 不 超过 4KB。 
储 少量 的 数据 。 

在 Flask 中 操作 cookie, 是 通过 response 对 象 来 实现 的 , 可 以 在 response 返回 之 前 ， 
来 设置 ， 这 个 方法 有 以 下 几 个 参数 需要 注意 。 

key: 设置 的 cookie 的 key。 

value: key 对 应 的 value。 


断 当 前 用 户 是 哪个 了 。 
因此 使 用 cookie 只 能 存 


通过 response set_cookie 


max_age: 设置 cookie 的 过 期 时 间 ， 如 果 不 设置 ， 则 浏览 器 关闭 后 就 会 自动 过 期 。 


expires: 到 expires 设置 的 时 间 失 效 ， 应 该 是 一 个 datetime 类 型 。 


domain: 该 cookie 在 哪个 域名 中 有 效 。 一 般 设置 子 域名 ， 例 如 cms.example.com。 


path: 该 cookie 在 哪个 路 径 下 有 效 。 

具体 代码 如 下 。 

from flask import request 

app=Flask(_ name ) 

@app.route('/') 

def index(): 
username = request.cookies.get('username') 

设置 cookie: 

@app.route('/') 

def index(): 
resp = make_response("hello world") 
resp.set cookie('username', 'the username') 
return resp 

删除 cookie: 

def index(): 


resp = make_response ("hello world") 


resp.set_cookie('username'，'the username',expires=0) # 实 质 上 就 是 将 过 期 时 间 设 置 为 0 


return resp 
session 和 cookie 的 作用 有 点 儿 类 似 ， 都 是 为 了 存储 用 户 相 关 的 信息 。 不 同 的 是 ， 
览 器 ， 而 session 是 存储 在 服务 器 。 存 储 在 服务 器 的 数据 会 更 加 安全 ， 不 容易 被 窃取 。 


cookie 是 存储 在 本 地 浏 
但 存储 在 服务 器 也 有 一 


定 的 弊端 ， 就 是 会 占用 服务 器 的 资源 ， 但 服务 器 发 展 至 今 ， 存 储 一 些 session 信息 还 是 绰绰有余 的 。 
Flask 中 的 session 是 通过 from flask import session， 然 后 添加 key 和 value 进去 即 可 。 
client side session: Flask 中 的 session 机 制 是 将 session 信息 加 密 ， 然 后 存储 在 cookie 中 。 专 业 术语 叫 作 


client side session 。 


server side session: 存储 在 服务 器 ， 客 户 端 保存 的 是 session_ id 〈 通 过 cookie 完成 )。 


from flask import Flask, session, redirect, url for, request 
app = Flask(_name ) 
@app.route('/') 
def index(): 
if 'username' in session: 
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~ 


return 'Logged in as $s' % session['username'] # 获 取 session 中 的 username 
return 'Hi,You are not logged in' 
Q@app.route('/login', methods=['GET', "POST']) 


def login(): 
if request.method == 'POST': 
session['username'] = request.form.get ('username') # 将 表单 中 传 入 的 username 作为 session 中 


的 username 值 传 入 
return redirect (url_for('index'")) 
return ''"' 
<form action="" method="post"> 
<p><input type=text name=username> 
<p><input type=submit value=Login> 
</form> 
En 
Qapp.route('/logout') 
def logout(): 
session.pop('username', None) #session 中 删 掉 username, 实际 就 是 设置 其 为 空 
return redirect (url for('index')) 。 # 跳 转 回 index 页 面 


app.config['SECRET_KEY']="123456" 4 设置 密 铀 
app.run (port=5001, debug=True) 


除 上 述 设置 密 钥 方 法 外 还 可 以 使 用 如 下 方法 进行 设置 。 

app.secret key = 'A0Zr98j/3yX R~ XHH!jmN]LWX/,?RT'/example 

5. Flask 中 的 重 定向 、 跳 转 与 错误 

当 用 户 访问 一 些 需要 登录 的 页 面 时 ， 如 果 用 户 没 有 登录 ， 那 么 会 重 定向 到 登录 页 面 。 

跳 转 多 用 于 旧 网 址 在 废弃 前 转向 新 网 址 以 保证 用 户 的 访问 ， 有 页 面 被 永久 性 移 走 的 概念 。 而 重 定向 表 
示 页 面 的 展示 性 转移 ， 通 常 使 用 Flask 下 的 redirect 实现 ， 代 码 如 下 。 


from flask import Flask,request, redirect,url for 
app=Flask(_ name _) 
@app.route('/') 
def index(): 
return redirect (url for('myindex1')) 
Qapp.route('/myindex1') 
def myindexl (): 
return "index1" 
def index2(): 
abort (404) 
app. run (Port=5001,debug=True) 


在 代码 中 使 用 abort(code) 会 放弃 请 求 并 返回 错误 代码 code。 之 后 的 语句 不 会 再 执行 默认 情况 ， 错 误 代 
码 会 显示 一 个 黑白 的 错误 页 面 。 如 果 要 定制 错误 页 面 ， 可 以 使 用 errorhandler0 装 饰 器 。 


from flask import render template 
@app.errorhandler (404) 
def page not found(error): 
return render template('page not found.html'), 404 


注意 render template0 调 用 之 后 的 404。 它 告诉 Flask， 该 页 的 错误 代码 是 404， 即 没有 找到 (网 页 不 存 
在 )。 默 认为 200， 也 就 是 一 切 正常 。 
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6. 模板 与 泻 染 

在 Python 中 生成 HTML 实际 上 是 一 个 很 烦琐 的 过 程 ， 不 过 在 Flask 下 已 经 配置 好 了 Jinja2 的 模板 ， 避 
免 了 这 一 烦琐 的 过 程 。 接 下 来 介绍 有 关 知 识 。 

模板 可 以 保持 应 用 程序 与 网 页 的 布局 或 者 界面 逻辑 是 分 开 的 ， 这 样 用 户 会 更 加 容易 组 织 。 

1) 泻 染 模板 

需要 先导 入 render templatem 模块 ， 然 后 先 在 文件 所 在 目录 创建 一 个 文件 来， 命名 为 templates， 然 后 
在 文件 夹 中 新 建 一 个 HIML 网 页 文件 , 如 图 20-4 所 示 ( 演 染 时 框架 会 自动 寻找 网 页 文件 ,不 必 添 加 templates 
这 个 路 径 ， 这 是 由 Flask 框架 决定 的 )。 


Y Mtemplates 


图 20-4 目录 结构 


直接 返回 泻 染 的 index.html。 


刷新 网 页 可 以 看 到 泻 染 好 的 网 页 ， 如 图 20-5 所 示 。 


> © [O200r5000 | 


This is index Page ! 


图 20-5 运行 结果 


2) 传递 参数 到 网 页 显示 
HTML 中 参数 的 传递 需要 用 的 是 两 个 大 括号 {{}}， 并 把 参数 写 入 其 中 ， 代 码 如 下 。 
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网 页 的 前 端 代码 执行 后 ， 便 使 用 flask 编写 后 全 代码 。 


刷新 网 页 之 后 会 得 到 如 图 20-6 所 示 结 果 。 


Ic 


© 127.00.1:5000 


This is index Page ! 
The word is | Love Flask ! 


图 20-6 运行 结果 


7. 文件 上 传 
Flask 下 的 文件 上 传 是 利用 request.files， 使 用 时 一 定 要 记 住 设置 enctype="multipart/form-data" 属 性 (将 
文件 以 二 进 制 形式 上 传 )， 否 则 浏览 器 不 会 发 送 文件 。 
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</form> 


app.run (port=10000, debug=True) 

8. 数据 库 的 使 用 

数据 库 操作 在 Web 开发 中 扮演 着 一 个 很 重要 的 角色 ， 网 站 中 很 多 重要 的 信息 都 需要 保存 到 数据 库 中 ， 
如 用 户 名 、 密 码 等 。Django 框架 是 一 个 基于 MVT 思想 的 框架 ， 也 就 是 说 它 本 身 就 已 经 封装 了 Model 类 ， 
可 以 在 文件 中 直接 继承 过 来 。 但 是 在 Flask 中 ， 并 没有 把 Model 类 封装 好 ， 需 要 使 用 一 个 扩展 包 Flask- 
SQLAlchemy。 它 是 一 个 对 数据 库 的 抽象 ， 让 开发 者 不 用 编写 这 些 SQL 语句 ， 而 是 使 用 其 提供 的 接口 去 操 
作 数 据 库 ， 这 其 中 涉及 一 个 非常 重要 的 思想 : ORM。 什么 是 ORM 呢 ? 

1) ORM 

ORM 的 全 称 是 Object Relationship Map， 即 对 象 -关系 映射 ， 主 要 功能 是 实现 模型 对 象 到 关系 型 数据 库 
数据 的 映射 ， 就 是 使 用 通过 对 象 去 操作 数据 库 。 

ORM 操作 过 程 图 如 图 20-7 所 示 。 


框架 ORM 关系 数据 库 
转换 成 特定 数据 库 中 的 
j 象 的 insert MySQL 
对 ] 
update 
人 [一 delete 
语句 Oracle 
删除 


查询 上 -二 一 一 | 转换 成 特定 数据 库 的 select 语 句 


-下 | 从 数据 库 中 返回 数据 集 ， 在 转换 成 


Python 中 的 列表 


图 20-7 ORM 操作 过 程 


ORM 的 优点 如 下 。 

(1) 不 需要 编写 SQL 代码 ， 这 样 可 以 把 精力 放 在 业务 逻辑 处 理 上 。 
(2) 使 用 对 象 的 方式 去 操作 数据 库 。 实 现 数 据 模型 与 数据 库 的 解 耦 ， 利 于 开发 。 
ORM 的 缺点 是 性 能 较 低 。 

2) 如 何 使 用 Flask 中 的 数据 库 操作 

(1) 导入 第 三 方 数据 库 扩展 包 : 

from flask_sqlalchemy import SQLAlchemy 

(2) 配置 config 属性 ， 连 接 数 据 库 : 


app.config["SQLALCHEMY DATABASE URI"]="mysql://root:mysql@localhost/first flask" 
app.config["SQLALCHEMY TRACK MODIFICATIONS"] = False 


如 果 设 置 为 Trme (默认 值 )，Flask-SQLAlchemy 将 追踪 对 象 的 修改 并 且 发 送信 号 。 这 需要 额外 的 内 存 ， 
在 这 里 禁用 它 。 

(3) 创建 数据 库 first_flask。 

(4) 创建 操作 数据 库 对 象 : 

db =SQLAlchemy(app) 

对 于 第 〈2) 步 中 数据 库 引擎 的 设置 可 根据 表 20-1 使 用 URL 指定 数据 库 。 
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表 20-1 数据 库 引 擎 与 URL 


数据 库 引擎 URL 
MySQL mysql+pymysql://username:password@hostname/database 
Postgres postgresql://username:password(@hostname/database 
SQLite(UNIX) sqlite:////absolute/path/to/database 
SQLite(Windows) ‘absolute/path/to/database 


【 例 20-1】 在 Flask 下 创建 一 个 表 并 添加 数据 。 


from flask import Flask 
from flask sqlalchemy import sQLAlchemy 
from settings import Config 


app = Flask(_ name _) 
app.config.from object (Config) 
# 创 建 数据 库 实例 对 象 

db = SQLAlchemy (app) 


class Role(db.Model) : 
wun 创建 角色 模型 类 """ 


_tablename = 'roles’ 


id = db.Column (db.Integer, primary key=True) 
name = db.column (db.string (64), unique=True) 


+ 描述 roles 表 和 users 表 的 关系 

# 第 一 个 参数 为 模型 类 名 

# 第 二 个 参数 backref 为 模型 类 名 声明 新 属性 , 这 样 就 可 以 实现 反 向 查询 
# 第 三 个 参数 决定 了 什么 时 候 从 数据 库 中 查询 数据 


us = db.relationship('User', backref='role', lazy='dynamic') 
def _repr (self): 


return 'Role:%s' $% self.name 


class User(db.Model): 
"创建 用 户 模型 类 """ 


#4 设置 表 名 

_tablename = 'users' 

# 添 加 主键 

id = db.Column (db.Integer, primary key=True) 
用户 名 


name = db.column (db.string (30), unique=True) 

email = db.column (db.string(64), unique=True) 

password = db.column (db.string (64)) 

# 定 义 一 个 外 键 

role id = db.Column (db.Integer, db.ForeignKey('roles.id')) 
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但 是 这 么 创建 其 实 会 报 一 个 sqlalchemy.exc.IntegrityError 错误 , 这 是 因为 字段 的 唯一 性 与 debug 的 自动 
调试 有 冲突 。 解 决 办 法 有 以 下 两 种 。 

第 一 种 ， 不 要 将 删除 表 和 创建 表 这 两 句 注释 ， 每 次 执行 都 要 带 着 这 两 句 话 。 无 论 是 debug 模式 自动 执 
行 还 是 手动 执行 程序 ， 都 会 先 删除 表 然后 再 创建 表 ， 所 以 执行 多 少 次 都 不 怕 。 

第 二 种 :关闭 debug 模式 ， 即 app.mn0。 

【 例 20-2】Pymysql 的 增删 改 查 。 
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20.2 Django Web 网 站 框架 


哺 澡 遇 20.2.1 Django 框架 简介 


Django 项 目 是 一 个 Python 定制 框架 ， 它 源 自 一 个 在 线 新 闻 Web 站 点 ， 于 2005 年 以 开源 的 形式 被 释放 
出 来 。Django 框架 的 核心 组 件 如 下 。 

(1) 用 于 创建 模型 的 对 象 关系 映射 。 

(2) 为 最 终 用 户 设计 的 完美 管理 界面 。 

(3) 一 流 的 URL 设计 。 

(4) 设计 者 友好 的 模板 语言 。 

(5) 缓存 系统 。 


20.2.2 Django 框架 安装 
方法 一 : 使 用 pip 工具 。 


更 新 pip 的 版 本 : 

python -m pip install --upgrade pip 
首先 要 确保 安装 了 pip 工具 : 

pip install Django 

方法 二 :使 用 git。 


$ git clone git://github.com/django/django.git 

$ pip install -e django/ 

方法 三 : 下 载 Django 的 py 包 ， 然 后 使 用 Python 命令 安装 。 
检测 是 否 安装 成 功 : 

In [1]: import django 

In [2]: django.VERSION 

Out[2]: (1, 11, 4, u'final', 0) 


Django 默认 提供 SQLite 数据 库 ， 安 装 Python 和 MySQL 的 连接 模块 。 
pip install PyMysQL 连接 数据 库 


20.2.3 ”Dijango 框架 第 一 个 程序 


如 果 是 第 一 次 使 用 Django, 那么 现在 进入 工作 目录 , 然后 执行 如 下 命令 , 这 会 自动 生成 一 些 建 立 Django 
项 目的 代码 。 

$ django-admin startproject myweb 

进入 myweb 目录 ， 看 看 startproject 创建 了 什么 东西 。 


$ tree 


上 一 manage.py 
[一 一 myweb 


| 
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上 一 settings.py 
上 一 urls.py 
一 一 vsgi.py 
这 些 目录 和 文件 的 作用 如 下 。 
外 部 myweb/ 根 目录 只 是 一 个 项 目的 容器 。 它 的 名 字 与 Django 无 关 ， 可 以 将 其 重 命名 为 自己 喜欢 的 任 
何 内 容 。 
manage.py: 一 个 命令 行 实用 程序 ， 可 以 让 用 户 以 各 种 方式 与 此 Django 项 目 进行 交互 。 
内 部 myweb/ 目 录 是 项 目的 实际 Python 包 。 它 的 名 字 是 需要 用 来 导入 其 中 的 任何 内 容 的 Python 包 名 称 
(例如 myweb.urls)。 
myweb/_init _.py: 一 个 空 的 文件 ， 告 诉 Python 这 个 目录 应 该 被 认为 是 一 个 Python 包 。 
myweb/settings.py: 此 Django 项 目的 设置 /配置 。Django 设置 会 告诉 用 户 所 有 关于 设置 的 工作 原理 。 
myweb/urls.py: 该 Django 项 目的 URL 声明 ; Django 网 站 的 “目录 ”。 
myweb/wsgi.py: WSGI 兼容 的 Web 服务 器 为 项 目 提供 服务 的 入 口 点 。 
Python manage.py runserver 0.0.0.0:8000 


这 样 我 们 访问 http:/127.0.0.1:8000/ 就 会 看 到 如 图 20-8 所 示 的 结果 ， 就 说 明 项 目 启动 成 功 了 。 


lt worked! 
Congratulations on your first Django-powered page. 


Of course, you haven't actually done any work yet Next, start your first app by running prrioe ease py sta7ta09 Tope 1a%e]. 


You're seeing this message because you have EBL ~ rue in your Django settings file and you haven't configured any URLs Get to work! 


图 20-8 执行 结果 
20.2.4 Django 框架 的 基本 使 用 
1. 路 由 与 构造 url 
基本 代码 格式 如 下 。 


from django.conf.urls import url 


urlpatterns = [ 
url (正则 表达 式 ，views 视图 函数 ,参数 ,别名 ) ， 
] 


Django 2.0 版 本 中 的 路 由 系统 已 经 营 换 成 下 面 的 写法 (官方 文档 ): 

from django.urls import path 

urlpatterns = [ 
path('articles/2003/', views.special case 2003), 
path('articles/<int:year>/', views.year archive), 
path('articles/<int:year>/<int:month>/', views.month archive), 
path('articles/<int:year>/<int:month>/<slug:slug>/', views.article detail), 

] 

正则 表达 式 : 一 个 正则 表达 式 字符 串 。 

views 视图 函数 ， 一 个 可 调用 对 象 ， 通 常 为 一 个 视图 函数 或 一 个 指定 视图 函数 路 径 的 字符 

参数 ， 可 选 的 要 传递 给 视图 函数 的 默认 参数 〈 字 典 形式 )。 

别名 : 一 个 可 选 的 name 参数 。 


地 
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2. Request 对 象 的 基本 使 用 


在 每 一 个 视图 函数 中 都 会 先 引用 request 对 象 ， 它 是 view0 函 数 的 第 一 个 参数 ， 基 本 使 用 如 下 。 


request .scheme 


代表 请 求 的 方案 ,http 或 者 https 


request .path 


请 求 的 路 径 ,例如 请 求 127.0.0.1/org/1ist, 那 这 个 值 就 是 /org/1ist 


request .method 


表示 请 求 使 用 的 http 方法 ,GET 或 者 POST 请 求 


request .encoding 
表示 提交 数据 的 编码 方式 
request .GET 

获取 GET 请 求 

request .POST 


获取 PosT 请 求 , 例如 前 端 提交 的 用 户 密码 , 可 以 通过 request .POST.get () 来 获取 
另外 ， 如 果 使 用 POST 上 传 文件 的 话 ， 文 件 信息 将 包含 在 FILES 属性 中 


request .COOKIES 
包含 所 有 的 cookie 
request .META 


一 个 标准 的 Python 字典， 包含 所 有 的 HTTP 首部 。 具 体 的 头 部 信息 取决 于 客户 端 和 服务 器 ， 下 面 是 一 
些 实 例 。 
CONTENT_LENGTH 一 一 请 求 的 正文 的 长 度 (是 一 个 字符 囊 )。 
CONTENT_TYPE 一 一 请 求 的 正文 的 MIME 类 型 。 

HTTP_ACCEPT 一 一 响应 可 接收 的 Content-Type。 
HTTP_ACCEPT_ENCODING 一 一 响应 可 接收 的 编码 。 
HTTP_ACCEPT_LANGUAGE 一 一 响应 可 接收 的 语言 。 

HTTP_HOST 一 一 客服 端 发 送 的 HTTP Host 头 部 。 

HTTP_REFERER 一 一 Referring 页 面 。 

HTTP_USER_AGENT 一 一 客户 端的 user-agent 字符 串 。 
QUERY_STRING 一 一 单个 字符 串 形式 的 查询 字符 串 〈 未 解析 过 的 形式 )。 
REMOTE_ADDR 一 一 客户 端的 IP 地址 。 
REMOTE_HOST 一 一 客户 端的 主机 名 。 
REMOTE_USER 一 一 服务 器 认证 后 的 用 户 。 

REQUEST_METHOD 一 一 一 个 字符 串 ， 例 如 "GET" 或 "POST"。 
SERVER_NRME 一 一 服务 器 的 主机 名 。 
SERVER_PORT 一 一 服务 器 的 端口 〈 是 一 个 字符 串 )。 


Fedquest .user 


一 个 AUTH_ USER_MODEL 类 型 的 对 象 ， 表 示 当 前 登录 的 用 户 。 
如 果 用 户 当前 没有 登录 ，user 将 设置 为 django.contrib.auth.models.AnonymousUser 的 一 个 实例 。 可 以 通 
过 is_authenticated0O 区 分 它们 。 


把 request 传 给 前 端的 时 候 ， 
request .session 


3. Get 和 Post 请 求 传 参 


A 


且 病 


可 以 通过 {% frequest.user.is_authenticated  “%} 判 断 用 户 是 否 登 录 。 


在 前 面 Flask 中 演示 了 表单 提交 ， 那 么 在 Diango 中 又 是 如 何 实现 的 呢 ? 


代码 如 下 : 
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之 后 在 helloworld/templates 下 创建 一 个 testhtml， 代 码 如 下 。 


最 后 在 helloworld/helloworld/urls.py 中 添加 url 请 求 处 理 。 


注意 : 在 post 表单 中 ， 当 直接 提交 的 时 候 会 产生 CSRF 的 错误 ， 此 时 先 采 用 禁用 的 方式 ， 在 setting 中 
将 MIDDLEWARE CLASSES 中 的 一 个 中 间 件 叫 作 django.middleware.csrf.CsrfViewMiddleware 注释 掉 。 


/AN 
hon 从 入 门 到 项 目 实践 ( 超 值 版 ) 
NO 


4. CSRF 的 问题 
Django 中 使 用 post 的 话 会 遇 到 如 下 的 错误 ， 如 图 20-9 所 示 。 


Forbidden (oy 


CRF writieatim futled Bogest shorted 
Toy ape aminf Whis nrzer becaumm this site regsirer > CINF cookie shen rbuitting foms. Ti cockie ji meqcired for srewrity ewans, to maure That your brower 1 not beine bjacked by third 


I yo jam emfigured yo brower to tesble codkies, plewe ewable then, we lost for ta site, or {or “maererigis re 


Help 
Teneo gin for foil 
CH 


20-9 ”错误 执行 结果 


这 个 错误 的 意思 是 CSRF 校 验 失败 ，request 请 求 被 丢弃 掉 。 下 面 先 来 了 解 下 什么 是 CSRF。 

CSRF 即 Cross Site Request Forgery( 跨 站 点 伪造 请 求 )。 举 例 来 讲 ， 某 个 恶意 的 网 站 上 有 一 个 指向 你 的 
网 站 的 链接 ， 如 果 某 个 用 户 已 经 登录 到 你 的 网 站 上 了 ， 那 么 当 这 个 用 户 单 击 这 个 恶意 网 站 上 的 那个 链接 时 ， 
就 会 向 你 的 网 站 发 来 一 个 请 求 ， 你 的 网 站 会 以 为 这 个 请 求 是 用 户 自己 发 来 的 ， 其 实 这 个 请 求 是 那个 恶意 网 
站 伪造 的 。 

假如 用 户 ab 登录 了 银行 的 网 站 ， 并 且 向 abe2 进行 了 转账 ， 对 银行 发 送 的 请 求 是 http://bank.example/ 
withdraw?account=abc&amount=1000000&cfor=abc2。 通 常情 况 下， 请 求 发 送 到 服务 器 后 ， 服 务 器 会 首先 验证 
是 否 是 合法 的 session， 如 果 是 则 转账 成 功 。 假 设 黑客 也 有 同样 银行 的 账号 。 他 知道 转账 的 时 候 会 生成 如 上 
的 请 求 链接 。 黑 客 也 可 以 发 送 同 样 的 请 求 给 服务 器 要 求 转账 给 自己 。 但 是 服务 器 校 验 他 的 这 个 请 求 不 是 合 
法 的 session。 因 此 黑客 想到 了 CSRF 的 方式 .他 自己 做 一 个 网 站 , 在 网 站 中 放置 如 下 链接 : http://bank.example/ 
withdraw?account=abc&amount=1000000&for=heike 并 且 通 过 广告 或 其 他 的 方式 诱 使 abe 单 击 这 个 链接 ， 上 
述 URL 就 会 从 abe 的 浏览 器 发 向 银行 ， 而 这 个 请 求 会 附带 abe 浏览 器 中 的 cookie 一 起 发 向 银行 服务 器 。 大 
多 数 情况 下 ， 该 请 求 会 失败 ， 因 为 他 要 求 abe 的 认证 信息 。 但 是 ， 如 果 abe 当时 恰巧 刚 访问 他 的 银行 后 不 
久 ， 他 的 浏览 器 与 银行 网 站 之 间 的 session 尚未 过 期 ， 浏 览 器 的 cookie 之 中 含有 abe 的 认证 信息 。 这 时 ， 悲 
剧 发 生 了 ， 这 个 URL 请 求 就 会 得 到 响应 ， 钱 将 从 abe 的 账号 转移 到 黑客 的 账号 ， 而 abc 当时 毫 不 知情 。 
那么 解决 办 法 是 什么 呢 ? 
CSRF 攻击 之 所 以 能 够 成 功 , 是 因为 黑客 可 以 完全 伪造 用 户 的 请 求 , 该 请 求 中 所 有 的 用 户 验 证 信息 都 是 
存在 于 cookie 中 ， 因 此 黑客 可 以 在 不 知道 这 些 验 证 信息 的 情况 下 直接 利用 用 户 自己 的 cookie 来 通过 安全 验 
证 。 要 抵御 CSRF， 关 键 在 于 在 请 求 中 放 入 黑客 所 不 能 伪造 的 信息 ， 并 且 该 信息 不 存在 于 cookie 之 中 。 可 
以 在 HTTP 请 求 中 以 参数 的 形式 加 入 一 个 随机 产生 的 token， 并 在 服务 器 端 建立 一 个 拦截 器 来 验证 这 个 
token， 如 果 请 求 中 没有 token 或 者 token 内 容 不 正确 ， 则 认为 可 能 是 CSRF 攻击 而 拒绝 该 请 求 。 

那么 回 到 Django 中 的 post 失败 ， 有 以 下 两 种 解决 办 法 。 

解决 办 法 一 : 将 CSRF 中 间 层 注释 掉 。 

MIDDLEWARE = [ 

"django.middleware.security.SecurityMiddleware'y 


"django .contrib.sessions.middleware.SessionMiddleware'y 
"django.middleware.common.CommonMiddleware'y 
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# 'django.middleware.csrf.CsrfviewMiddleware', 
'django.contrib.auth.middleware.AuthenticationMiddleware', 
'django.contrib.messages.middleware.MessageMiddleware', 
'django.middleware.clickjacking.XFrameoptionsMiddleware', 


] 
此 时 将 不 会 进行 CSRF 的 校 验 ， 但 如 前 面 所 述 ， 这 是 一 种 不 安全 的 行为 ， 而 且 Djano 也 不 推荐 使 用 。 
解决 办 法 二 : 在 前 面 的 提示 中 有 这 样 一 句 话 : 


In any template that uses a POST form, use the csrf token tag inside the <form> element if the 


form is for an internal URL, e.g.: 


<form action="" method="post">{% csrf token %} 

也 就 是 说 ， 在 网 页 中 加 入 csrf token 的 标签 就 可 以 通过 CSRF 校 验 。 

Django 提供 的 CSRF 防护 机 制 如 下 。 

(1) Django 第 一 次 响应 来 自 某 个 客户 端的 请 求 时 ,会 在 服务 器 端 随机 生成 一 个 token， 把 这 个 token 放 在 


cookie 里 。 然 后 每 次 POST 请 求 都 会 带 上 这 个 token， 这 样 就 能 避免 被 CSRF 攻击 。 


在 


(2) 在 返 


器 


的 HTTP 响应 的 cookie 里 , Django 会 添加 一 个 csrftoken 字段 , 其 值 为 一 个 自动 生成 的 token， 


E 所 有 的 POST 表单 时 ， 必 须 包含 一 个 csrfmiddlewaretoken 字段 (只 需要 在 模板 里 加 一 个 tag，Django 就 会 


自动 帮 用 户 生 成 ， 见 下 面 )。 


(3) 在 处 理 POST 请 求 之 前 ,Django 会 验证 这 个 请 求 的 cookie 里 的 csrftoken 字段 的 值 和 提交 的 表单 里 


的 csrfmiddlewaretoken 字段 的 值 是 否 一 样 。 如 果 一 样 ， 则 表明 这 是 一 个 合法 的 请 求 ， 否 则 ， 这 个 请 求 可 能 
是 来 自 于 别人 的 CSRF 攻击 ， 返 回 403 Forbidden。 


(4) 在 所 有 AJAX POST 请 求 里 ， 添 加 一 个 X-CSRFTOKEN header， 其 值 为 cookie 里 的 csrftoken 的 值 。 


5. cookie 与 session 在 Django 中 的 使 用 
cookie 与 session 的 定义 在 Flask 中 已 经 进行 了 阐述 ， 接 下 来 直接 看 看 在 Django 中 如 何 直接 应 用 。 
【 例 20-3】 添 加 cookie。 


def login(req) : 
if req.method=="POST" : 
uf = UserInfoForm (req.POST) 
if uf.is valid(): 
username = uf.cleaned data["username"] 
password = uf.cleaned data["password"] 
print username,password 
users = UserInfo.objects.filter (username=username,password=password) 
if users: 
response = HttpResponseRedirect ("/index/") 
response.set cookie ("username",username,3600) 
return response 
else: 
return HttpResponseRedirect ("/login") 
# return HttpResponseRedirect () 
else: 
uf = UserInfoForm() 
return render to response("login.html", {"uf":uf}) 
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【 例 20-4】 获 得 cookie。 


nee EE TE 20-5】 删 除 cookie。 


【 例 20-6】 gr Session 。 


【 例 20-7】 获 取 session 。 


【 例 20-8】 删 除 session 。 
del req.sessionl'usernanel 
6. 模板 与 泻 染 
在 Django 中 主要 通过 render0 这 个 函数 进行 泻 染 。 
【 例 20-9】 通 过 render0) 函 数 泻 染 。 


通过 上 述 的 第 三 个 参数 ， 就 能 将 变量 传递 给 HTML 进行 泻 染 达到 想 要 的 目的 ! 


7. 数据 库 的 使 用 
Django 中 每 一 个 model 都 对 应 于 数据 库 中 的 一 张 表 ， 每 个 model 中 的 字段 都 对 应 于 数据 库 表 的 列 。 
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方便 的 是 ，Django 可 以 自动 生成 这 些 create table,alter table,drop table 的 操作 。 

想 想 看 , 如 果 每 次 修改 Django 中 的 数据 模型 , 又 要 去 同步 修改 数据 库 中 的 模型 , 是 多 么 麻烦 的 一 件 事 。 
更 不 用 说 那些 容易 发 生 的 细节 上 的 错误 了 。 

1) 创建 模型 

假设 要 为 一 个 shopping mall 创建 一 个 简单 的 数据 模型 。 

商场 里 分 各 个 区 域 ， 如 化 妆 品 区 、 女 装 区 、 男 装 区 等 。 对 应 Area 模型 ， 有 字段 区 域名 name， 描 述 
description， 管 理 人 员 manager。 

接着 ， 在 每 个 区 域 中 又 有 许多 商铺 。 对 应 Store 模型 ， 有 字段 商铺 名 name， 外 键 area (area 与 store 为 
一 对 多 关系 )。 

而 每 个 商铺 里 ， 贩 卖 各 种 商品 。 对 应 Item 模型 ， 有 字段 商品 名 name， 价 格 price， 外 键 store (store 与 
item 为 一 对 多 关系 )。 

【 例 20-10】 数 据 库 的 使 用 。 


from django.db import models 
from django .contrib.auth.models import User 


class Area(mode15.Model) : 
name = models.CharField (max_length=30) 
description = models.CharField (max_ length=100) 
manager = models.ForeignKey (User, blank=True, null=True) 


def _ str (self): 
return self.name 
class Store (models.Model): 
name = models.CharField (max_length=30) 
area = models.ForeignKey (Area, on delete=models.CASCADE, related name='stores') 
def _str (self): 


return self.name 


class Item(models.Model): 
name = models.CharField (max_length=30) 
price = models.IntegerField!() 
store = models.ForeignKey (store, on delete=models.CASCADE) 


def _str (self): 
return self.name 


(1) 主键 

我 们 注意 到 ， 在 上 面 定义 model 时 ， 并 没有 定义 主键 。 这 是 因为 除非 显 式 指定 ，Django 会 自动 为 模型 
增加 一 个 字段 名 为 id 的 主键 。 

id = models.AutoField (primary key=True) 

当然 ， 也 可 以 自 定义 主键 ， 只 要 给 字段 设置 primary key=True 就 可 以 了 。 这 时 候 ，Django 就 不 会 自动 
为 模型 设置 id 主键 了 。 

Primary key=True 意味 着 null=False 以 及 unique=True。 也 就 是 说 ， 主 键 是 非 空 且 独一无二 的 ， 它 是 
来 在 这 个 表 中 标识 这 一 行 数 据 的 。 
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在 Django 的 模型 中 ， 主 键 也 是 只 读 的 。 

(2) 外 键 

在 模型 中 定义 外 键 时 ， 同 步 数据 库 后 ，Django 默认 在 外 键 字段 名 后 加 上 “_id” 作 为 数据 库 表 的 
列 名 。 

ForeignKey0 常 用 的 额外 参数 如 下 。 

级 联 删除 ，on_delete=models.CASCADE。 

反 向 查询 : 如 在 Store 模型 的 外 键 store 字段 中 设置 realted_name='stores'， 可 以 在 关系 的 另 一 端 即 area 
端 反 向 查询 到 stores。 

(3) _ str_0 方 法 

给 每 个 模型 定义 _str 0 方法 是 一 个 很 好 的 做 法 ， 这 不 只 是 为 了 交互 时 方便 ， 也 是 因为 Django 会 在 其 
他 一 些 地 方 用 _str_() 来 显示 对 象 。 

注意 : _str_( 方 法 必须 返回 字符 囊 。 

2) 生成 模型 
每 一 次 对 model 的 修改 ， 都 需要 运行 以 下 两 条 命令 来 同步 数据 库 。 
1 Python manage.py makemigrations 
2 Python manage.py migrate 


(1) makemigrations 

其 中 第 一 条 命令 的 作用 是 生成 migrations 文件 。 

在 我 们 的 例子 中 ， 执 行 makemigrations 后 shell 中 会 有 以 下 输出 。 
1 Migrations for 'shop': 

2 0001 initial.py: 


3 - Create model Area 
4 - Create model Store 
5 - Create model Item 


而 这 时 候 ， 在 我 们 的 app shop 中 能 看 到 一 个 migrations 文件 夹 ， 打 开 0001_initialpy， 就 能 看 到 对 应 的 


migration 语句 。 


(2) migrate 

而 第 二 条 命令 的 作用 是 将 这 些 migrations 应 用 到 数据 库 上 去 。 

在 我 们 的 例子 中 ， 执 行 migrate 后 shell 中 会 有 以 下 输出 。 

1 Operations to perform: 

2 Apply all migrations: silk, sessions, admin, auth, shop, contenttypes 

3 Running migrations: 

4 Rendering model states... DONE 

5 Applying shop.0001 initial... OK 

自动 生成 的 表 名 为 app 名 (shop) 和 模型 的 小 写 名 称 (area,store,item) 的 组 合 (用 下 画 线 组 合 )。 如 在 
app shop 下 的 模型 Area 对 应 数据 库 中 的 shop_area 表 。 

(3) 说 明 

每 个 app 的 migration 文件 都 会 在 app 中 的 migrations 文件 夹 下 被 生成 。 

在 Django 中 ， 每 一 次 对 模型 以 及 模型 中 的 字段 的 增加 、 删 除 或 修改 ， 都 会 在 执行 python manage.py 
makemigrations 后 生成 相应 的 migrations。 
建议 仔细 检查 makemigrations 后 shell 中 的 输出 ， 尤 其 是 在 对 模型 进行 了 复杂 的 改变 时 。 检 查 完毕 后 再 
执行 migrate。 
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当然 , 如 果 在 运行 makemigrations 后 反悔 了 ,可 以 不 执行 migrate， 而 是 转 去 删除 刚刚 生成 的 migrations 
交 件 。 

everyone deserves a second chance 

3) 数据 库 的 基本 操作 

(1) 增 

先 为 shopping mall 增加 一 个 化 妆 品 区 : 


from django.shortcuts import HttpResponse 
from .models import Area 


def add_area (request) : 
area = Rrea.objects.create (name='cosmetic',， description=' 充 满 香 味 儿 ') 
return HttpResponse('added!') 


中 ， 代 码 area = Area.objects.create(name='cosmetic',description=' 充 满 香 味 儿 ) 所 对 应 的 MySQL 语句 为 : 
insert into shop area(name, description) values('cosmetic'，' 充 满 香 味 儿 ') 7 
(2) 查 
现在 列 出 shopping mall 中 的 所 有 区 域 。 
【 例 20-11】 实例 文件 : ch20\Chap20.44.txt) 


from django.shortcuts import HttpResponse 
from .models import Area 


def list areal(request): 
area = Area.objects.all() 
print (area) # 在 shell 中 输出 [<Area: 'cosmetic'>]，, 如 果 没 有 定义 str _() ,将 输出 无 意义 的 


[<Area: Area object>] 


return HttpResponse('listed!') 
代码 area = Area.objects.all0 相 当 于 MySQL 语句 : 
select * from shop area; 
复习 一 下 : shop_area 为 Django 为 模型 自动 生成 的 表 名 (app_model)。 
(3) 改 
在 〈1) 中 ， 并 没有 为 化 妆 品 区 指定 管理 人 员 。 现 在 ， 修 改 化 妆 品 区 的 信息 ， 将 rinka 指定 为 管理 


> 
Bo 


首先 ， 要 创建 一 个 rinka 用 户 。 这 里 将 创建 一 个 名 为 rinka 的 superuser: 
python manage.py create superuser 

接着 ， 将 创建 的 rinka 用 户 指 定 为 化 妆 品 区 的 管理 人 员 。 

from django.shortcuts import HttpResponse 


from .models import Area 
from django.contrib.auth.models import User 


def update area (request) : 
rinka = User.objects.get (username='rinka') 
area = Area.objects.get (id=1) 
area.manager = rinka 
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注意 : 必须 调用 对 象 的 save() 方 法 ， 对 象 实例 的 修改 才 会 保存 到 数据 库 中 去 。 这 是 一 个 容易 出 错 的 
地 方 。 
第 8 一 10 行 代码 对 应 的 MySQL 语句 为 : 


复习 一 下 : manager_id 为 Django 默认 为 外 键 生成 的 列 名 (foreignkey id)。 
(4) 删 
删除 操作 很 简单 ， 现 在 来 删除 数据 库 表 shop_area 中 id 为 1 的 那 一 行 数据 。 


第 6 一 7 行 语句 对 应 的 MySQL 语句 为 : 


总 结 : 
Django 中 数据 库 基 本 操作 如 下 。 


1. 同步 数据 库 


2. 增 
Model.objectscreate('varg 
3. 查 
uelobjectsaall) 
4. 改 
5. 删 


第 国 章 “Web 网 站 编程 技术 


20.3 ”就 业 面试 技巧 与 解析 


20.3.1 面试 技巧 与 解析 (一) 


面试 官 : 简 述 对 Django、Flask 的 理解 ? 

应 聘 者 : 

Django 框架 : 遵循 MTV 框架 设计 ， 自 带 内 嵌 的 ORM 框架 ，Admin 后 台 管 理 ， 自 带 的 SQLite 数据 库 
和 开发 测试 用 的 服务 器 给 开发 者 提高 了 开发 效率 。 
Flask 框架 : 自由 、 灵 活 、 可 扩展 性 强 。 其 核心 基于 Werkzeug WSGI 工具 和 jinja2 模板 引擎 的 一 个 微型 
框架 ，Werkzeug 本 质 是 Socket 服务 端 ， 用 于 Web 开发 中 接收 HTTP 请 求 并 预 处理 ， 然 后 触发 Flask 框架 ， 
将 处 理 结果 返回 用 户 。 如 果 处 理 复杂 用 户 信息 ， 可 以 借助 jinja2 将 模板 和 数据 进行 泻 染 ， 并 将 泻 染 后 信息 
返回 给 用 户 浏览 器 。 


20.3.2 ”面试 技巧 与 解析 (二 ) 


面试 官 : 简 述 Tomado 框架 主要 模块 及 介绍 ? 

应 聘 者 : 

Tornado 主要 模块 : 

web - FriendFeed 基础 Web 框架 ， 包 含 了 Tomado 的 大 多 数 重要 的 功能 ; 
escape - XHTML，JSON，URL 的 编码 /解码 方法 ; 

database - 对 MySQLdb 的 简单 封装 ， 使 其 更 容易 使 用 ; 

template - 基于 Python 的 web 模板 系统 ; 

httpclient - 非 阻塞 式 HTTP 客户 端 ， 它 被 设计 用 来 和 web 及 httpserve 协同 工作 ; 
locale - 针对 本 地 化 和 翻译 的 支持 ; 

options - 命令 行 和 配置 文件 解析 工具 ， 针 对 服务 器 环境 做 了 优化 底层 模块 ; 
httpserver - 服务 于 web 模块 的 一 个 非常 简单 的 HTTP 服务 器 的 实现 ; 
iostream - 对 非 阻塞 式 的 Socket 的 简单 封装 ， 以 方便 常用 读 写 操作 ; 

ioloop - 核心 的 IO 循环 。 
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> 学 习 指引 


人 们 更 喜欢 通过 直观 的 表达 方式 来 感受 计算 机 处 理 的 结果 ， 因 此 便 出 现 了 GUI。 使 用 GUI， 大 大 提高 
了 计算 机 与 用 户 的 交互 性 ， 使 用 户 的 操作 更 加 方便 灵活 。Python 中 有 许多 开发 GUI 的 库 ， 本 章 主要 介绍 
tkinter 这 个 库 。 学 好 这 个 库 是 十 分 重要 的 ， 它 内 容 丰 富 ， 功 能 强大 。 本 章 主 要 学 习 使 用 tkinter 创建 GUI 时 
的 一 些 基本 组 件 和 方法 ， 了 解 tkinter 函数 。 学 习 完 本 章 内 容 便 可 以 写 一 个 属于 自己 的 完整 化 窗口 小 程序 了 ， 
是 不 是 非常 有 趣 ? 


二 ”重点 导读 


。 认 识 GUI。 

。 认 识 tkinter。 

。 掌 握 tkinter 常用 组 件 。 
“掌握 tkinter 常用 布局 。 
。 了 解 响应 事件 机 制 。 
“掌握 tkinter 对 话 框 。 


21.1 GUI 简介 


图 形 用 户 界 面 (Graphical User Interface，GUI， 又 称 图 形 用 户 接口 ) 是 指 采 用 图 形 方式 显示 的 计算 机 操 
作用 户 界面 。 与 早期 计算 机 使 用 的 命令 行 界面 相 比 ， 图 形 界面 对 于 用 户 来 说 在 视觉 上 更 易于 接受 。 然 而 界 
面 若 要 通过 在 显示 屏 的 特定 位 置 ， 以 各 种 美观 而 不 失 单调 的 视觉 消息 提示 用 户 状态 的 改变 ， 比 简单 的 消息 
呈现 要 花 上 更 多 的 计算 能 力 。 

图 形 用 户 界 面 是 一 种 人 与 计算 机 通信 的 界面 显示 格式 ， 人 允许 用 户 使 用 鼠标 等 输入 设备 操纵 屏幕 上 的 图 
标 或 菜单 选项 ， 以 选择 命令 、 调 用 文件 、 启 动 程序 或 执行 其 他 一 些 日 常任 务 。 与 通过 键盘 输入 文本 或 字符 
命令 来 完成 例 行 任务 的 字符 界面 相 比 ， 图 形 用 户 界面 有 许多 优点 。 图 形 用 户 界面 由 窗口 、 下 拉 菜 单 、 对 话 
框 及 其 相应 的 控制 机 制 构成 ， 在 各 种 新 式 应 用 程序 中 都 是 标准 化 的 ， 即 相同 的 操作 总 是 以 同样 的 方式 来 完 
成 ， 在 图 形 用 户 界面 ， 用 户 看 到 和 操作 的 都 是 图 形 对 象 。 
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21.2 Python 中 编写 GUI 的 库 


Python 中 含有 多 个 图 形 开 发 界面 的 库 ， 常 见 的 几 种 图 形 化 界面 库 如 下 。 

(1) Jython: Jython 程序 可 以 和 Java 无 缝 集 成。 除了 一 些 标准 模块 ，Jython 使 用 Java 的 模块 。Jython 外 
几乎 拥有 标准 的 Python 中 不 依赖 于 C 语言 的 全 部 模块 。 例 如 ，Jython 的 用 户 界面 将 使 用 Swing、AWT 或 
者 SWT。Jython 可 以 被 动态 或 静态 地 编译 成 Java 字 节 码 。 

(2) tkinter: tkinter 模块 (从 接口 ) 是 Python 的 标准 东 GUI 工具 包 的 接口 。 信 和 tkinter 可 以 在 大 多 数 
的 UNIX 平台 下 使 用 , 同样 可 以 应 用 在 Windows 和 Macintosh 系统 里 。 Tk8.0 的 后 续 版 本 可 以 实现 本 地 窗口 
风格 ， 并 良好 地 运行 在 绝 大 多 数 平台 中 。 

(3) wxPython: wxPython 是 一 款 开源 软件 ， 是 Python 语言 的 一 套 优秀 的 GUI 图 形 库 ， 人 允许 Python 程 
序 员 很 方便 地 创建 完整 的 、 功 能 齐全 的 GUI 用 户 界 面 。 


21.3 tkinter 图 形 化 库 


21.3.1 tkinter 简介 


tkinter 是 Python GUI 库 。Python 使 用 kinter 可 以 快速 地 创建 GUI 应 用 程序 。 由 于 tkinter 是 内 
置 到 Python 的 安装 包 中 ， 只 要 安装 好 Python 之 后 就 能 导入 tkinter 库 。 而 且 IDLE 也 是 用 tkinter 编写 而 成 。 
对 于 简单 的 图 形 界 面 SA 还 是 能 应 付 自如 。tkinter( 也 叫 世 接口 ) 是 全 图 形 用 户 界面 工具 包 标准 的 Python 
接口 。 人 k 是 一 个 轻 量 级 的 跨 平台 图 形 用 户 界面 (GUI) 开发 工具 。 你 和 tkinter 可 以 运行 在 大 多 数 的 UNIX 
平台 、Windows 和 Macintosh 系统 中 。 
tkinter 定数 量 的 模块 组 成 。tkinter 位 于 一 个 名 为 _tki nter( 较 早 的 版 本 名 为 tki nter) 的 二 进 制 模块 
中 。tkinter 包含 对 全 的 低级 接口 模块 ， 低 级 接口 并 不 会 被 应 用 级 程序 员 直 接 使 用 ， 通 常 是 一 个 共享 库 (或 
DLL)， 但 是 在 一 些 情况 下 它 也 被 Python 解释 器 静态 链接 。 


21.3.2 安装 tkinter 库 | 


在 使 用 tkinter 库 前 ， 必 须 先 把 这 个 库 安装 到 编译 软件 里 。 
步骤 1: 检查 安装 ， 以 下 信息 显示 我 们 没有 安装 这 个 库 ， 如 图 21-1 所 示 。 
步骤 2: 安装 ， 可 以 直接 输入 如 图 21-2 所 示 内 容 。 


图 21-1 没有 安装 图 21-2 安装 tkinter 库 


21.3.3 ”导入 tkinter 库 


计算 机 里 有 了 tkinter 库 后 ， 在 编程 时 ， 需 要 导入 这 个 库 ， 才 能 使 用 其 中 的 功能 。 导 入 tkinter 模块 一 般 
采用 的 方法 如 图 21-3 所 示 。 
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图 21-3 导入 tkinter 库 


时 21.3.4 ”创建 图 形 用 户 界面 步 又 


Python 的 GUI 用 户 界面 有 一 个 主 窗 口 ， 这 个 主 窗口 中 又 有 各 种 各 样 的 组 件 。 主 窗口 和 各 种 组 件 都 称 为 
对 象 ， 具 有 属性 和 方法 。tkinter 图 形 库 是 一 个 基于 面向 对 象 思想 的 用 户 界 面 设计 工具 包 ， 所 以 要 充分 掌握 
面向 对 象 的 思想 。 创 建 图 形 化 界面 的 主要 步骤 如 下 。 

(1) 创建 主 窗口 。 

(2) 添加 组 件 并 设置 组 件 属性 。 

(3) 调整 对 象 的 位 置 和 大 小 。 

(4) 为 组 件 添加 事件 处 理 机 制 。 

(5) 进入 主事 件 循环 。 

接 下 来 用 一 个 实例 创建 一 个 简单 的 GUI 界面 程序 。 

【 例 21-1】 创 建 一 个 简单 窗口 。 

from tkinter import * 

+# 创 建 根 窗口 

root = Tk() 

# 设 置 窗口 标题 

root.title(" 第 一 个 窗口") 

# 设 置 窗口 大 小 

root .geometry ("300x200") 

# 在 窗 体 中 创建 一 个 框架 ,用 它 来 承载 其 他 小 部 件 

app = Frame (root) 

# 设 置 布局 管理 器 

app.grid() 

label = Label (app, text=" 你 好 ") 

label.grid() 

btn = Button (app) 

btn.grid() 

# 通 过 configure () 方法 操作 

ptn.configure (text = "请 点 击 ") 

root .mainloop () 


程序 运行 结果 如 图 21-4 所 示 。 


21-4 第 一 个 窗口 
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21.4 tkinter 库 中 的 组 件 


21.4.1 组 件 分 类 


窗口 化 界面 中 的 内 容 都 是 由 一 个 个 组 件 组 成 ， 例 如 按钮 、 文 本 框 、 标 签 、 菜 单 栏 等 。 目 前 有 15 种 tkinter 
的 组 件 ， 下 面 对 这 些 组 件 做 一 个 简单 的 介绍 。 

Button 按钮 控件 ， 在 程序 中 显示 按钮 。 

Canvas 画布 控件 ， 显 示 图 形 元 素 ， 如 线条 或 文本 。 

Checkbutton 多 选 框 控件 : 用 于 在 程序 中 提供 多 项 选择 框 。 

Entry 输入 控件 ， 用 于 显示 简单 的 文本 内 容 。 

Frame 框架 控件 ;在 屏幕 上 显示 一 个 矩形 区 域 ， 多 用 来 作为 容器 。 

Label 标签 控件 ， 可 以 显示 文本 和 位 图 。 

Listbox 列表 框 控 件 ， 在 Listbox 窗口 中 的 部 件 是 用 来 显示 一 个 字符 串 列 表 给 用 户 。 

Menubutton 菜单 按钮 控件 ， 用 于 显示 菜单 项 。。 

Menu 菜单 控件 ， 显示 菜单 栏 、 下 拉 菜 单 和 弹出 菜单 。 

Message 消息 控件 : 用 来 显示 多 行文 本 ， 与 Label 比较 类 似 。 

Radiobutton 单 选 按钮 控件 ， 显 示 一 个 单 选 的 按钮 状态 。 

Scale 范围 控件 ， 显 示 一 个 数值 刻度 ， 为 输出 限定 范围 的 数字 区 间 。 

Scrollbar 滚动 条 控件 ， 当 内 容 超 过 可 视 化 区 域 时 使 用 ， 如 列表 框 。 

Text 文本 控件 ， 用 于 显示 多 行文 本 。 

Toplevel 容器 控件 ， 用 来 提供 一 个 单独 的 对 话 框 ， 和 Frame 比较 类 似 。 

Spinbox 输入 控件 : 与 Entry 类 似 ， 但 是 可 以 指定 输入 范围 值 。 

PanedWindow: 是 一 个 窗口 布局 管理 的 插件 ， 可 以 包含 一 个 或 者 多 个 子 控件 。 

LabelFrame: 是 一 个 简单 的 容器 控件 。 常 用 于 复杂 的 窗口 布局 。 

从 MessageBox: 用 于 显示 应 用 程序 的 消息 框 。 

所 有 控件 都 具有 共同 属性 ， 如 大 小 、 字 体 和 颜色 等 ， 这 些 属性 可 以 丰富 组 件 的 内 容 ， 使 图 形 化 界面 更 
加 美观 。 我 们 对 控件 的 属性 做 如 下 介绍 。 

Dimension: 控件 大 小 。 

Color: 控件 颜色 。 

Font: 控件 字体 。 

Anchor: 锚 点 。 

Relief: 控件 样式 。 

Bitmap: 位 图 。 

Cursor: 光标 。 


21.4.2 布局 组 件 


tkinter 控件 有 特定 的 几何 状态 管理 方法 ， 管 理 整个 控件 区 域 组 织 的 方法 就 是 布局 。 所 谓 布 局 ， 就 是 指 
控制 窗 体 容器 中 各 个 控件 (组件) 的 位 置 关系 。 
人 kinter 共有 三 种 几何 布局 管理 器 ， 分 别 是 : pack 布局 、grid 布局 、place 布局 。 接 下 来 简单 了 解 一 下 这 
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些 布局 。 


E: 


1. pack 布局 


A 
hen 丛 入门 到 项 目 实践 ( 超 值 版 ) 


使 用 pack 布局 ， 将 向 容器 中 添加 组 件 ， 第 一 个 添加 的 组 件 在 最 上 方 ， 然 后 依次 向 下 添加 。pack 的 常用 
属性 如 表 21-1 所 示 。 


属性 名 属性 简介 


fl 设置 组 件 是 否 向 水 平 或 垂直 方向 填充 


设置 组 件 是 否 展开 ， 当 值 为 YES 时 ，side 选 


项 无 效 。 组 件 显示 在 父 容器 中 心 位 置 ; 若 fl expand-YES 
pmd 选项 为 BOTH， 则 填充 父 组 件 的 剩余 空间 。 | “Es、 NO (1、 0) pail NO 
默认 为 不 展开 


表 21-1 pack 的 常用 属性 

取 值 说 明 
f= 义 ( 水 平方 向 填充 ) 
fl=Y (垂直 方向 填充 ) 
f=BOTH (水 平和 垂直 ) 
NONE 不 填充 


LEFT、TOP、RIGHT、 
ji 设置 组 件 的 对 齐 方 、 上 、 右 、 下 
side 设置 组 件 的 式 | 值 为 左 、 上 、 右 


件 之 间 的 间隔 ) 


设置 x 方向 (或 者 y 方向 ) 内 部 问 阶 ( 子 组 | 可 设置 数值 ， 默 认 是 0 | 非 负 整 数 ， 单 位 为 像素 


设置 x 方向 (或 者 y 方向 ) 外 部 间隙 (与 之 | 一， 二 
0 ee 可 设置 数值 ， 默 认 是 0 | 非 负 整 数 ， 单 位 为 像素 


anchor 


除 此 之 外 ，pack 类 还 提供 


锚 选 项 ， 当 可 用 空间 大 于 所 需求 的 尺寸 时 , 
决定 组 件 被 放置 于 容器 的 何 处 


N、E、S、W、NW、 
NE、SW、SE、CENTER | 表示 八 个 方向 以 及 中 心 
(默认 值 为 CENTER) 


了 下 列 函 数 〈 使 用 组 件 实例 对 象 调用 )。 


pack _slaves0: 以 列表 方式 返回 本 组 件 的 所 有 子 组 件 对 象 。 

pack_configure(option=value): 给 pack 布局 管理 器 设置 属性 ， 使 用 属性 (option) = 取 值 (value) 方式 
设置 。 

propagate(boolean): 设置 为 True 表示 父 组 件 的 几何 大 小 由 子 组 件 决定 (默认 值 )， 反 之 则 无 关 。 


pack_info0: 返回 pack 提供 的 选项 所 对 应 的 值 。 


pack forgetO0: unpack 组 件 ， 将 组 件 隐藏 并 且 忽略 原 有 设置 ， 对 象 依旧 存在 。 


location(x,y): 〈x,y) 为 以 像素 为 单位 的 点 ， 函 数 返 回 此 点 是 否 在 单元 格 中 ， 以 及 在 哪个 单元 格 中 。 返 匠 
E 标 ，(-1,-1》 表 示 不 在 其 中 。 


元 格 行列 和 4 


2. grid 布局 
grid 布局 又 被 称 作 网 格 布 


局 ， 是 大 家 喜欢 使 用 的 布局 。 我 们 可 以 很 容易 地 把 它 划 分 为 一 个 几 行 几 列 的 


网 格 , 然后 根据 行 号 和 列 号 , 将 组 件 放置 于 网 格 之 中 。 使 用 grid 布局 时 ， 用 row 表示 行 ， 用 column 表示 列 。 
注意 ，row 和 column 的 序号 都 从 0 开始 。grid 的 常用 属性 如 表 21-2 所 示 。 
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表 21-2 grid 的 常用 属性 


属 性 名 属性 简介 取 值 取信 说 明 
row 为 行 号 ，column 为 列 号 ， 设 置 将 组 | 取 值 为 行 、 列 的 序号 ， | row 和 column 的 序号 都 从 
TOW、59 on | 件 放置 于 第 几 行 第 几 列 不 是 行 数 与 列 数 0 开始 
wy 设置 组 件 在 网 格 中 的 对 齐 方式 Re 类 似 于 pack 布局 中 的 错 选项 
攻 攻 取 值 为 跨越 占用 的 行 数 , 而 不 
es 组 件 所 跨越 的 行 数 跨越 的 行 数 a 
取 值 为 跨越 占用 的 列 数 , 而 不 
组 件 | 的 的 
columnspan 组 件 所 跨越 的 列 数 跨越 的 列 数 是 序号 
a a 
ipadx、ipady、 | 组 件 的 内 部 、 外 部 间隔 距离 ， 与 pack 的 司 喇 汪 后 品 还 


padx、pady 该 属性 用 法 相同 


除 此 之 外 ，grid 类 还 提供 了 下 列 函 数 〈 使 用 组 件 实例 对 象 调用 )。 

grid_slaves0: 以 列表 方式 返回 本 组 件 的 所 有 子 组 件 对 象 。 

grid_configure(option=value): 给 pack 布局 管理 器 设置 属性 ， 使 用 属性 (option) = 取 值 (value) 方式 
设置 。 

grid_propagate(boolean): 设置 为 True 表示 父 组 件 的 几何 大 小 由 子 组 件 决定 〈 默 认 值 )， 反 之 则 无 关 。 

grid_ info0: 返回 pack 提供 的 选项 所 对 应 的 值 。 

grid_forget0: unpack 组 件 ， 将 组 件 隐藏 并 且 忽 略 原 有 设置 ， 对 象 依旧 存在 。 

grid_location(x,y): (x,y) 为 以 像素 为 单位 的 点 ， 函 数 返回 此 点 是 否 在 单元 格 中 ， 以 及 在 哪个 单元 格 中 。 
返回 单元 格 行列 坐标 ，(-1,-1) 表示 不 在 其 中 。 

3. place 布局 

place 布局 是 最 简单 最 灵活 的 一 种 布局 ， 使 用 组 件 坐标 来 放置 组 件 的 位 置 。 但 是 不 太 推 荐 使 用 ， 在 不 同 
分 辩 率 下 ， 界 面 往往 有 较 大 差异 。place 的 常用 属性 如 表 21-3 所 示 。 


表 21-3 place 的 常用 属性 


属性 名 取 值 说 明 
anchor 锚 选 项 ， 同 pack 布局 默认 值 NW 同 pack 布局 
x y 组 件 左上 角 的 x、y 坐标 整数 ， 默 认 值 0 绝对 位 置 坐标 ， 单 位 像素 
相对 位 置 , 0.0 表示 左边 缘 (或 
Telx、rely 组 件 相 对 于 父 容器 的 x、y 坐标 0 一 1 浮 点 数 上 边缘 )，1.0 表示 右边 缘 (或 
下 边缘 ) 
width、height 组 件 的 宽度 、 高 度 非 负 整数 单位 像素 
relwidth、relheight | 组 件 相对 于 父 容器 的 宽度 、 0 一 1 浮 点 数 与 relx (rely) 取 值 相似 
如 果 设 置 为 INSIDE， A 党 
RE 和 位 置 是 相对 的 ,不 包括 边框 , 如 果 是 | INSIDE、OUTSIDE 
OUTSIDE, 组 件 的 外 部 大 小 是 相对 的 ， | “〈 默 认 值 NSIDE) i ; 
包括 边框 形式 "inside" "outside" 


除 此 之 外 ，place 类 还 提供 了 下 列 函 数 〈 使 用 组 件 实例 对 象 调用 )。 
place slaves0: 以 列表 方式 返回 本 组 件 的 所 有 子 组 件 对 象 。 
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place_configure(option=value): 给 pack 布局 管理 器 设置 属性 ， 使 用 属性 (option) = 取 值 (value) 方式 设置 。 

propagate(boolean): 设置 为 True 表示 父 组 件 的 几何 大 小 由 子 组 件 决定 (默认 值 )， 反 之 则 无 关 。 

place_info(): 返回 pack 提供 的 选项 所 对 应 的 值 。 

place_forget0: unpack 组 件 ， 将 组 件 隐藏 并 且 忽略 原 有 设置 ， 对 象 依旧 存在 。 

location(x,y): (xy) 为 以 像素 为 单位 的 点 ， 函 数 返回 此 点 是 否 在 单元 格 中 ， 以 及 在 哪个 单元 格 中 。 返 
单元 格 行列 坐标 ，(-1-1) 表示 不 在 其 中 。 


器 


21.5 “常用 组 件 


21.5.1 按钮 组 件 


按钮 (Button) 也 称 命令 组 件 ， 是 图 形 用 户 界 面 最 常见 的 组 件 ， 它 是 用 户 命令 程序 进行 某 项 操作 的 基本 
手段 。 一 个 简单 的 按钮 ， 用 来 响应 用 户 的 一 个 单 击 操作 ， 能 够 与 一 个 Python 函数 关联 ， 当 按钮 被 单 击 时 ， 
自动 调用 该 函数 。 下 面 的 语句 表示 在 A 窗口 中 添加 了 一 个 按钮 控件 : 
>>>btn=Button (A, text=” Quit” ),command=A.quit) 
其 中 ， 属 性 command 是 按钮 的 核心 ， 它 一 般 和 函数 连用 ， 单 击 这 个 按钮 时 则 会 触发 这 个 函数 执行 下 一 
【 例 21-2】 创 建 一 个 按钮 。 
from tkinter import * 
def onclick(): 
Print ("点 击 成 功 !11") 
root = Tk() 
#4 实例 化 Button, 使 用 command 选项 关联 一 个 函数 ， 单 击 按钮 则 执行 该 函数 
button = Button (root, text=' 这 是 一 个 按钮 ', fg='black', command=onclick) 
# 设 置 pack 布局 方式 
button.pack() 
root .mainloop () 


程序 运行 结果 如 图 21-5 所 示 。 
单 击 一 次 按钮 能 看 到 结果 如 图 21-6 所 示 。 
【3 - DO x 


| 


FETIDEEE 
图 21-5 创建 一 个 按钮 图 21-6 ， 单 击 按钮 


mb 


:5.2 ”标签 组 件 


tkinter 模块 定义 了 Label 类 来 创建 标签 控件 。 创 建 标签 时 需要 指定 其 父 控件 和 文本 内 容 ， 前 者 由 Label 
构造 函数 的 第 一 个 参数 指定 ， 后 者 用 属性 text 指定 。 

>>>aLabel=Label (A, text=" 你 好 ", bg="green", fg="black",width=50) 

可 以 看 到 标签 还 有 其 他 属性 ， 例 如 bg 控制 标签 背景 颜色 ,fg 控制 标签 文本 颜色 ，width 控制 标签 的 宽 
度 等 。Label 用 于 显示 一 个 文本 或 图 像 。 
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Label 的 属性 可 以 直接 参考 按钮 , 事实 上 按钮 就 是 一 个 特殊 的 标签 , 只 不 过 按钮 多 出 了 单 击 响应 的 功能 。 
【 例 21-3】 创 建 一 个 标签 。 

from tkinter import * 

root = Tk() 

label 1 = Label (root, text=" 我 是 标签 ", bg="green", fg="black",width=50) 

label 1.pack() 
root .mainloop () 


程序 运行 结果 如 图 21-7 所 示 。 


文本 框 (Entry) 用 于 输入 和 编辑 文本 。 输 入 过 程 中 图 21-7 ”创建 标签 


随时 可 以 进行 编辑 ， 如 光标 定位 、 修 改 、 插 入 等 。tkinter 
模块 提供 的 Entry 类 可 以 实现 单行 文本 的 输入 和 编辑 。 下 面 的 语句 创建 并 布置 一 个 单行 文本 框 控件 : 


>>>Entry (A) .pack 


需要 注意 一 点 ，Entry 与 Lable 和 Button 不 同 ， 其 text 属性 是 无 效 的 。 当 用 户 输入 数据 之 后 ， 应 用 程序 


要 用 某 种 方法 来 获取 用 户 的 输入 ， 方 便 对 输入 的 数据 进行 处 理 。 可 以 通过 Entry 对 象 中 的 textvariable 属性 
将 文本 框 与 一 个 StringVar 类 型 的 控制 变量 关联 。 


StringVar 类 属于 tkinter， 在 界面 编程 的 时 候 ， 需 要 跟踪 变量 值 的 变化 ， 以 保证 值 的 变更 随时 可 以 显示 


在 界面 上 。 由 于 Python 无 法 做 到 这 一 点 ， 所 以 使 用 了 tcl 的 相应 对 象 ， 也 就 是 StringVar。StringVar 除了 set 
外 还 有 其 他 的 函数 ， 包 括 : get 用 于 返回 StringVar 变量 的 值 ，trace (mode,callback) 用 于 在 某 种 mode 被 触 
发 的 时 候 调用 callback0 函 数 。 


Entry 还 可 以 将 其 state 属性 设置 为 readonly， 变 为 只 读 ， 则 单行 文本 框 不 能 编辑 ， 变 成 了 显示 文字 的 


Label。 


21.5.4 ”菜单 栏 组 件 


【 例 21-4】 创 建 一 个 单行 输入 文本 框 。 
from tkinter import * 

root = Tk() 

e = StringVar() 

# 使 用 textvariable 属性 , 绑 定 字符 串 变 量 e 
entry = Entry(root,textvariable = e) 
e.set (' 请 输入 …… by) 9 kk - OO x 
entry.pack() 请 妨 入 ….， 你 好 和 

root .mainloop () 


程序 运行 结果 如 图 21-8 所 示 。 


21-8 创建 一 个 单行 输入 文本 框 


菜单 (Menu) 也 是 常用 的 控件 之 一 。 莱 单 控件 是 一 个 由 许多 菜单 项 组 成 的 列表 ， 每 一 个 菜单 项 表示 一 


条 命令 或 一 个 选项 。 用 户 则 使 用 鼠标 或 者 键盘 对 菜单 进行 操作 。tkinter 模块 提供 Menu 类 创建 菜单 组 件 , 具 


体 


法 是 先 创建 一 个 菜单 控件 对 象 ， 并 与 某 个 窗口 〈 主 窗口 或 者 顶层 窗口 ) 进行 关联 ， 然 后 再 为 该 菜单 添 


加 菜单 项 。 不 同 的 菜单 项 用 不 同 的 方法 来 添加 ， 例 如 : 


简单 命令 : add_command0 
级 联 式 命令 : add_cascade() 
复 选 框 : add_checkbutton() 
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单 选 按钮 : add_ radiobutton0 
菜单 分 割 线 (使 菜单 结构 清晰 ): add_separatorO) 
【 例 21-5】 创 建 一 个 菜单 。 
from tkinter import * 
定义 一 个 顶级 大 窗口 
root = TK() 
# 在 大 窗口 下 定义 一 个 顶级 菜单 实例 
menubar = Menu (root) 
# 在 顶级 菜单 实例 下 创建 子 菜 单 实例 
fmenu = Menu (menubar) 
FOr aach an Dd 
fmenu.add command (label=each) 
vmenu = Menu (menubar) 
# 为 每 个 子 菜单 实例 添加 革 单 项 
or each dn "I ls 
vmenu.add command (label=each) 
emenu = Menu (menubar) 
For Gach Ln 
emenu.add command (label=each) 
amenu = Menu (menubar) 
ror each ln [1 2] 
amenu.add command (label=each) 
# 为 顶级 菜单 实例 添加 莱 单 , 并 级 联 相应 的 子 菜单 实例 
menubar.add_cascade (label='1',menu=fmenu) 
menubar.add cascade (label='2',menu=vmenu) 
menubar.add cascade (label='3',menu=emenu) 


menubar.add cascade (label='4',menu=amenu) fu * 
# 顶 级 菜单 实例 应 用 到 大 窗口 中 国 23 4 
root['menu']=menubar 
Foot .mainloop () | 
程序 运行 结果 如 图 21-9 所 示 。 3 
4 


lb 


.5.5 ”选择 性 组 件 图 21-9 ”创建 一 个 菜单 


1. 单 选 按钮 

选择 性 组 件 有 单 选 按钮 和 复 选 框 ， 先 来 了 解 一 下 单 选 按钮 ， 即 在 同一 组 内 只 能 有 一 个 按钮 被 选中 ， 每 
当选 中 组 内 的 一 个 按钮 时 ， 其 他 的 按钮 自动 改 为 非 选 中 态 。 与 其 他 控件 不 同 的 是 ， 它 有 组 的 概念 。tkinter 
模块 提供 的 Radiobutton 类 可 用 于 创建 单 选 按钮 ， 其 语法 格式 如 下 : 

>>>Radiobutton (A, text=" 选 项 一 ") .pack 

该 按钮 的 使 用 较为 简单 ， 同 样 使 用 command 关联 函数 ， 单 击 时 响应 。 实 际 应 用 中 是 将 多 个 相关 的 单 选 
按钮 组 合成 一 个 组 ， 使 得 每 次 都 只 能 有 一 个 按钮 被 选中 。 这 需要 创建 IntVar 和 StringVar 类 型 的 控制 变量 ， 
然后 将 同 组 的 每 个 单 选 按钮 的 variable 属性 都 设置 成 该 控制 变量 。 由 于 多 个 单 选 按钮 共享 一 个 控制 变量 ， 
而 控制 变量 只 能 取 一 个 值 ， 所 以 选中 一 个 单 选 按钮 就 会 导致 取消 另 一 个 。 

【 例 21-6】 创 建 单 选 按钮 。 


from tkinter import * 

def sel() : 
selection = "You selected the option " + str(var.get()) 
print (selection) 

root = Tk() 
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# 创 建 整 型 变量 ,用 于 绑 定 ,相同 的 整 型 变量 为 同一 组 


var = IntVar() 
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R1 = Radiobutton (Foot，text="Option 1", variable=var, value=1,command=sel) 
Rl.pack( anchor =W) 
R2 = Radiobutton (root, text="Option 2",variable=var,value=2,command=sel) 
R2.pack( anchor =W) 
R3 = Radiobutton (root, text="Option 3", variable=var, value=3,command=sel) 
R3.pack( anchor = W) 


Foot .mainloop () 


程序 运行 结果 如 图 


2. 复 选 框 


21-10 所 示 。 


复 选 框 用 来 提供 一 些 选项 供用 户 进行 选择 ， 用 户 可 以 选择 多 
项 。tkinter 模块 的 Checkbutton 类 用 于 创建 复 选 框 组 件 ， 其 用 法 


如 下 。 


>>>Checkbutton (A, text=" 选 项 一 ") . pack() 


在 实际 应 用 中 通常 


将 多 个 复 选 框 组 合 为 一 组 ， 为 用 户 提供 多 个 


(tk 

G Option 1 
COption 2 
COption3 


21-10 ”创建 单 选 按钮 


相关 的 选项 ， 用 户 可 以 从 中 选择 一 个 或 多 个 选项 。 可 使 用 variable 属性 将 复 选 框 与 一 个 IntVar 或 StringVar 


类 型 的 控制 变量 关联 ， 


用 来 查询 和 设置 选项 状态 。 


【 例 21-7】 创 建 复 选 框 。 


import tkinter as tk 


+# 主 窗口 
window = tk.Tk() 


window.geometry('300x300') 


# 复 选 框 


varl = tk.IntVar() 
Var2 = tk.IntVar() 
cl = tk.Checkbutton (window, text = 'Python', variable = varl, 


onval = 1, offval = 0 ) 

c2 = tk.Checkbutton (window, text = 'C++', variable = var2, 
onval = 1, offval = 0) 

cl.pack() 

c2.pack() 

# 主 事件 循环 

window.mainloop() 

程序 运行 结果 如 图 21-11 所 示 。 


21.5.6 ”绘制 图 形 


Python 强大 丰富 的 库 ， 不 仅 可 以 帮助 我 们 开发 窗口 化 小 程序 ， 还 能 帮助 我 们 实现 绘制 图 形 的 功能 。 
tkinter 中 的 Canvas 提供 了 绘图 功能 ， 其 提供 的 图 形 组 件 包括 线形 、 


控件 为 绘制 图 形 图 表 、 编 辑 图 形 、 自 定义 控件 提供 了 可 能 。 


1. 创建 一 个 画布 


如 果 要 画图 ， 就 需要 用 到 


21-11 创建 复 选 框 


圆 形 、 


图 片 ， 甚 至 其 他 控件 。Canvas 


canvas 〈 画 布 ) 对 象 ， 也 就 是 Canvas 类 的 对 象 由 tkinter 模块 提供 )。 创 建 


一 个 画布 时 ， 给 Python 传 入 画布 的 宽度 和 高 度 〈 以 像素 为 单位 )。 其 他 方面 和 按钮 的 代码 相同 。 


>>> from tkinter 
>>> tk = Tk() 


import* 


341 


/AN 
hon 从 入 门 到 项 目 实践 ( 超 值 版 ) 
NO 


>>> canvas = Canvas (tk,width=500,height=500) 
>>> canvas.pack() 


2. 开始 画 线 

要 在 画布 上 画 线 ， 就 要 用 到 像素 坐标 。 一 般 画 布 的 左上 角 为 起 点 坐标 〈0,0)， 画 布 的 右 下 角 为 终点 坐 
标 (500,500), 终点 坐标 根据 前 面 创建 画布 传 入 的 宽 高 大 小 所 得 。 我 们 用 create_line0 函 数 来 指定 这 些 坐 标 ， 
如 下 所 示 。 


>>> canvas.create line(0,0,500,500) 


函数 create_line 返回 1， 它 是 个 标志 。 如 果 要 用 turtle 模块 做 同样 的 事情 ， 那 就 需要 下 面 这 段 代 码 。 


>>> import turtle 

>>> turtle.setup (width=500,height=500) 
>>> t=turtle.Pen() 

>>> t.up() 

>>> 七 .goto(-250,250) 

>>> 七 .down () 

>>> 七 .goto(500,-500) 


需要 注意 的 是 ，tkinter 的 坐标 系 如 图 21-12 所 示 。 


O 


X 


图 21-12 tkinter 坐标 系 


21.6 事件 处 理 机 制 


用 户 的 各 种 操作 (例如 按键 ， 移 动 鼠 标 等 ) 会 产生 事件 。 事 件 随时 可 能 发 生 ， 而 且 量 也 可 能 会 很 大 ， 
事件 处 理 机 制 的 做 法 是 把 一 系列 的 事件 存放 一 个 队列 里 ， 逐 个 处 理 。 


21.6.1 ”什么 是 事件 


我 们 已 经 了 解 了 图 形 界面 以 及 其 内 部 的 组 件 如 何 创 建 ， 这 只 是 完成 了 窗口 化 程序 的 前 端 外 观 部 分 ， 接 下 
来 要 处 理 的 是 图 形 化 界面 的 另 一 个 重要 部 分 ， 对 所 有 组 件 对 象 进行 对 应 的 操作 功能 。 我 们 在 创建 按钮 时 就 已 
经 接触 了 事件 ， 图 形 化 界面 就 是 将 界面 的 对 象 与 程序 的 执行 相关 联 ， 产 生 一 种 新 的 程序 执行 模式 。 用 户 可 以 
通过 鼠标 或 者 键盘 ， 与 图 形 用 户 界面 进行 交互 操作 ， 交 互 发 生 时 会 产生 各 种 事件 ， 这 些 事件 就 是 要 对 程序 进 
行 响 应 和 处 理 。tkinter 模块 中 定义 了 很 多 种 事件 ， 帮 助 我 们 开发 图 形 化 程序 。 事 件 描述 的 一 般 形 式 是 : 

< 修饰 符 >-< 类 型 符 >-< 细 节 符 > 

1. 常用 的 键盘 和 鼠标 事件 


<Button-1> 鼠标 左 键 按 下 ，2 表示 中 键 ，3 表示 右键 
<ButtonPress-1> 同上 

<ButtonRelease-1> 鼠标 左 键 释放 

<B1-Motion> 按 住 鼠 标 左 键 移动 


342 


<Double-Button-1> 
<Enter> 

<Leave> 
<MouseWheel> 
<KeyPress-A> 


双击 左 键 
鼠标 指针 进入 某 一 组 件 | 
鼠标 指针 离开 某 一 组 件 | 
滚动 滚轮 


区 域 


区 域 


按 下 A 键 ，A 可 用 其 他 键 替代 
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<Alt-KeyPress-A> 同时 按 下 Alt 和 A; Alt 可 用 Ctrl 和 Shift 替代 
<Double-KeyPress-A> 快速 按 两 下 A 

<Lock-KeyPress-A> 大 写 状 态 下 按 A 

<Key> 键盘 的 任意 按键 

2. 常用 的 窗口 事件 

Activate 当 组 件 由 不 可 用 转 为 可 用 时 触发 
Configure 当 组 件 大 小 改变 时 触发 

Deactivate 当 组 件 由 可 用 转变 为 不 可 用 时 触发 
Destroy 当 组 件 被 销毁 时 触发 

Expose 当 组 件 从 被 遮挡 状态 中 暴露 出 来 时 触发 
Unmap 当 组 件 由 显示 状态 变 为 隐藏 状态 时 触发 
Map 当 组 件 由 隐藏 状态 变 为 显示 状态 时 触发 
FocusIn 当 组 件 获 得 焦点 时 触发 

FocusOut 当 组 件 失去 焦点 时 触发 

Property 当 窗 体 的 属性 被 删除 或 改变 时 触发 
Visibility 当 组 件 变 为 可 视 状态 时 触发 


21.6.2 ”响应 事件 


1. 响应 事件 对 象 


每 个 事件 都 能 导致 系统 创建 一 个 事件 的 对 象 ， 并 将 该 对 象 传递 给 事件 处 理 函 数 。 事 件 对 象 具有 描述 事 


件 的 属性 ， 常 用 属性 如 下 。 


char 返回 按键 字符 ， 仅 对 键盘 事件 有 效 
keycode 返回 按键 编码 ， 仅 对 键盘 事件 有 效 
keysym 返回 按键 名 ， 仅 对 键盘 事件 有 效 

num 鼠标 按键 ， 仅 对 鼠标 事件 有 效 

type 触发 的 事件 类 型 

widget 引起 事件 的 组 件 

width,height 组 件 改变 后 的 大 小 ， 仅 Configure 有 效 
Xxy 返回 鼠标 当前 位 置 ， 相 对 于 窗口 
xX_root,y_root 返回 鼠标 当前 位 置 ， 相 对 于 整个 屏幕 
2. 事件 绑 定 


一 个 tkinter 主要 跑 在 mainloop 进程 里 。Events 可 能 来 自 多 个 地 方 ， 例 如 按键 、 鼠 标 ， 或 是 系统 事件 。 
tkinter 提供 了 丰富 的 方法 来 处 理 这 些 事 件 。 对 于 每 一 个 控件 ， 都 可 以 为 其 绑 定 方法 。 对 象 绑 定 调用 控件 对 
象 的 bind( 方 法 实现 ， 一 般 形 式 如 下 : 
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控件 对 象 .bind (事件 描述 符 ， 事 件 处 理 程序 ) 

该 语句 的 含义 是 ， 若 控件 对 象 发 生 了 与 事件 描述 相符 的 事件 ， 则 调用 事件 处 理 程序 。 调 用 处 理 程序 时 ， 
系统 会 传递 一 个 Event 类 的 对 象 作为 实际 参数 ， 该 对 象 描述 了 所 发 生 事件 的 详细 信息 。 上 面 用 的 绑 定 方法 
是 绑 定 到 一 个 实例 对 象 上 ， 这 就 意味 着 ， 如 果 新 建 一 个 实例 ， 它 是 没有 绑 定 事件 的 。 

【 例 21-8】 创 建 按钮 绑 定 事件 。 

import tkinter as tk 

# 主 窗口 

window = tk.Tk() 

window.geometry('200x100') # 窗 口 尺 十 

+ 标签 

Var = tk.StringVar() 

1 = tk.Label (window, textvariable=var, bg='Yellow', font=('Aria', 12), width=15, height=2) 

1.pack() 

# 按 钮 的 响应 事件 

on_hit = False 

def hit_me() : 

global on hit 

if on hit == False: 
on hit = True 
var.set (' 点 击 成 功 ') 

else: 
on hit = False 
var.set('') 


#4 按钮 

b = tk.Button (window，text=' 请 点 击 '，width=15, height=2,，command=hit_me) 
b.pack() 

# 主 事件 循环 


window.mainloop() 


程序 运行 结果 如 图 21-13 所 示 。 


请 点 击 


21-13 ”按钮 单 击 成 功 事件 


21.7 ”对 话 框 


对 话 框 是 一 个 独立 的 顶层 窗口 ， 通 常 存在 于 执行 过 程 中 需要 弹出 的 窗口 ， 可 以 输入 和 显示 信息 。 对 话 
框 有 标准 对 话 框 (messagebox\filedialog\colorchooser) 和 自 定义 对 话 框 两 类 。 
oo} 


21.7.1 标准 对 话 框 


(1) messagebox 对 话 框 : 用 于 显示 信息 或 进行 简单 对 话 的 消息 框 。 
(2) filedialog 对 话 框 : 用 于 文件 浏览 、 打 开 和 保存 的 对 话 框 。 
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(3) colorchooser 对 话 框 : 用 于 选择 颜色 的 对 话 框 。 
【 例 21-9】 标 准 对 话 框 综合 应 用 。 


结果 如 图 21-14 所 示 。 


[a3 - 0 x 


程序 运行 


图 21-14 ”标准 对 话 框 综合 应 用 
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821.7.2， 自 定义 对 话 杠 


使 用 标准 对 话 框 时 会 发 现 ， 对 话 框 其 实 就 是 一 个 新 的 窗口 ， 那 么 要 想 自 定义 一 个 对 话 框 ， 便 可 以 使 
用 创建 窗口 的 方法 。 先 创建 一 个 项 级 窗口 ， 向 其 中 添加 需要 的 控件 和 事件 就 可 以 自 定义 属于 自己 的 简单 
对 话 框 。 
【 例 21-10】 创 建 按钮 绑 定 事件 。 
from tkinter import * 
def msg(): 
top=Toplevel (width=400, height=200) 
Label (top, text=' 点 击 成 功 ') .pack() 
w=TK () 
Button (w, text=" 点 击 ' Ccommand=msg) .pack () 
w.mainloop() 


程序 运行 结果 如 图 21-15 所 示 。 


图 21-15 自 定义 对 话 杠 


21.8 ”就 业 面试 技巧 与 解析 


21.8.1 面试 技巧 与 解析 (一) 


面试 官 : 什么 是 事件 的 关联 ? 

应 聘 者 : tkinter 应 用 程序 大 部 分 事件 都 在 事件 循环 中 (通过 mainloop 方法 进入 事件 循环 )， 事 件 来 自 于 
多 个 来 源 ， 例 如 用 户 的 键盘 的 输入 和 鼠标 操作 ， 以 及 WindowManager 的 重 绘 事件 (大 多 数 情况 下 不 是 由 用 
户 直接 调用 的 )。tkinter 提供 强大 的 机 制 让 用 户 自己 处 理事 件 , 每 个 组 件 都 可 以 为 各 种 事件 绑 定 Python 的 函 
数 和 方法 widget.bind(event,handler)。 如 果 组 件 中 发 生 了 与 event 描述 匹配 的 事 ， 将 调用 handler 指定 的 处 理 
程序 。 


21.8.2 面试 技巧 与 解析 〈 二 ) 


面试 官 : 事件 绑 定 的 三 个 级 别 是 什么 ? 

应 聘 者 : 

(1) 实例 绑 定 : 将 事件 与 一 特定 的 组 件 实例 绑 定 。 

(2) 类 绑 定 : 将 事件 与 一 组 件 类 绑 定 。 

(3) 程序 界面 绑 定 : 当 无 论 在 哪 一 组 件 实例 上 触发 某 一 事件 ， 程 序 都 做 出 相应 的 处 理 。 
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在 本 篇 中 ， 将 贯通 前 面 所 学 的 各 项 知识 和 技能 来 学 会 Python 在 游戏 开发 飞机 大 战 和 网 上 购物 系统 中 的 
应 用 技能 。 通 过 对 本 篇 的 学 习 ， 读 者 将 具备 使 用 Python 创建 与 设计 数据 库 系统 的 能 力 ， 并 为 日 后 进行 大 型 
数据 库 创建 与 管理 积累 经 验 。 


。 第 22 章 游戏 开发 飞机 大 战 
。 第 23 章 网 上 购物 系统 


第 22 章 
游戏 开发 飞机 大 战 


ae 学 习 指 引 


本 章 讲解 飞机 大 战 游戏 人 案例， 带领 读者 一 同 开发 这 款 游戏 ， 通 过 该 游戏 案例 了 解 Python 在 游戏 中 的 实 
际 开发 应 用 。 


全 ”重点 导读 


。 了 解 项 目 规划 的 方法 。 
“掌握 游戏 开发 的 封装 类 。 
“掌握 项 目 开发 步骤 。 


22.1 项目 规划 


飞机 大 战 项 目 规划 如 图 22-1 所 示 。 


绘制 处 理 


22-1 项 目 规划 
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22.2 封装 类 


将 游戏 中 使 用 到 的 角色 封装 成 类 ,一 个 游戏 中 的 角色 应 提前 构造 好 类 结构 ,这 样 整体 工程 便 有 了 基础 ， 
可 根据 不 同 角色 提前 规划 。 


22.2.1 角色 类 


角色 类 是 用 于 玩家 进行 操作 的 一 个 类 ， 该 类 用 于 绘制 角色 ， 具 有 根据 用 户 操作 改变 角色 位 置 的 功能 ， 
该 类 继承 自 pygame 中 的 精灵 类 。 
具体 代码 如 下 。 
import pygame 
from pygame.sprite import Sprite 
# 角 色 类 ,继承 于 精灵 类 
class Hero(Sprite) : 
二 创建 角色 对 象 
4# 传 入 窗口 宽 高 参数 
def _init (self,winwidth,winHeight): 
+ 调用 精灵 父 类 方法 
super(). init () 
# 记 录 窗 口 宽 高 
self.winwidth = winwidth 
self.winHeight = winHeight 
# 加 载 角 色 喷 火 飞行 图 片 的 两 帧 
# 这 里 由 于 角色 图 片 有 透明 区 域 , 因此 必须 使 用 convert_alpha () 来 转换 为 表面 对 象 
self.msurfacel = pygame.image.load("./images/mel.png") .convert_alpha() 
self.mSurface2 = pygame.image.load("./images/me2.png") .convert_alpha() 
上 # 以 第 一 幅 图 片 为 基准 获取 佐 形 对 象 
self.rect = self.msurfacel.get rect() 
# 定 义 飞行 速度 
self.speed = 10 
# 计 算 角色 出 现 的 位 置 , 此 处 使 其 出 现 的 位 置 位 于 窗口 偏 底 部 的 正中 央 
+ 通过 低 形 的 left 和 top 确定 算 形 区 域 的 位 置 
self.rect.left = self.winWidth // 2 - self.rect.width // 2 
self.rect.top = self.winHeight - 50 - self.rect.height 
# 从 msurfacel 生成 非 透明 区 域 训 单 ,用 于 做 碰撞 检测 
self.mask = pygame.mask.from surface(self.msurfacel) 
站 向 左 飞行 
def moveLeft (self): 
# 只 要 低 形 区 域 的 左边 缘 没 有 越界 ,就 持续 更 新 精灵 佐 形 的 位 置 
if self.rect.left > 0: 
Self.rect.left -= self.speed 
站 向 右 飞行 : 只 要 右 侧 没有 越界 就 持续 更 新 矩形 位 置 
def moveRight (self): 
if self.rect.right < self.winWidth: 
self.rect.left += self.speed 
# 向 上 飞行 : 只 要 佐 形 顶部 没有 越界 就 持续 更 新 矩形 的 位 置 
def moveUp (self) : 
if self.rect.top > 0: 
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self.rect.top -= self.speed 
#4 向 下 飞行 : 只 要 矩形 底部 没有 越界 就 持续 更 新 矩形 的 位 置 
def moveDown (self) : 

if self.rect.bottom < self.winHeight: 

Self.Frect.bottom += self.speed 

# 按 指定 向 量 移动 矩形 位 置 
def move(self,dx,dy): 

self.rect.left += dx 

self.rect.top += dy 


22.2.2 政 机 类 


敌 机 类 同样 继承 自 精灵 类 ， 该 类 只 做 机 械 性 操作 ， 敌 机 出 现时 在 屏幕 上 的 位 置 随机 ， 屏幕 出 现 的 
敌 机 数量 随机 ， 该 类 相对 比较 简单 ， 只 做 了 简单 的 绘制 与 移动 。 
具体 代码 如 下 。 


import random 
import pygame 
from pygame.sprite import Sprite 
#4 敌 机 类 
class smallEnemy (Sprite): 
#4 构造 方法 : 确定 外 形 、 确 定 初 始 位 置 、 引 擎 功率 
def _init (self, winwidth, winHeight): 
Sprite. init (self) 
self.winwidth = winwidth 
self.winHeight = winHeight 
+ 外形 
self.mSurface = pygame.image.load("./images/enemyl.png") .convert alpha() 
+ 爆炸 
self.dsurfacel = pygame.image.load("./images/enemyl downl.png") .convert_alpha() 
self.dsurface2 = pygame.image.load("./images/enemyl_ down2.png") .convert_alpha() 
self.dsurface3 = pygame.image.load("./images/enemyl down3.png") .convert alpha() 
self.dsurface4 = pygame.image.load("./images/enemyl down4.png") .convert alpha() 
self.dList = [self.dsurfacel, self.dsurface2, self.dsurface3, self.dsurface4] 
self.dIndex = 0 
+ 确定 敌 机 位 置 
self.rect = self.mSurface.get rect() 
self.reset () 
#4 敌 机 飞行 速度 
self.speed = 
+ 添加 碰撞 检测 造 单 
self.mask = pygame.mask.from surface (5elf.mSurface) 
# 重 置 敌 机 位 置 和 生命 
def reset (self): 
self.rect.left = random.randint (0, self.winWidth - self.rect.width) 
self.rect.top = 0 - random.randint (0, 1000) 
self.isAlive = True 
self.dIndex = 0 
# 机 械 地 向 下 飞行 


def move (5elf) : 
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22.2.3 子弹 类 


子弹 类 由 角色 发 起 ， 同 时 也 继承 自 精灵 类 ， 从 屏幕 的 底部 向 屏幕 的 项 部 移动 ， 如 果 与 敌 机 碰撞 可 以 销 
毁 敌 机 ， 同 时 子弹 销毁 。 
具体 代码 如 下 。 
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2.2.4 ”按钮 类 


按钮 类 用 于 控制 游戏 的 暂停 与 开始 ， 该 类 的 实质 是 控制 线程 的 暂停 与 启动 ， 同 时 根据 按钮 不 同 状态 绘 
| 相应 的 图 片 。 
具体 代码 如 下 。 


第 国 章 游戏 开发 飞机 大 战 


22.3 ”开发 步骤 


将 游戏 中 使 用 到 的 角色 封装 成 类 ,一 个 游戏 中 的 角色 应 提前 构造 好 类 结构 ,这样 整体 工程 便 有 了 基础 ， 


可 根据 不 同 角色 提前 规划 。 


22 


置 了 


.3.1 界面 绘制 


该 步骤 主要 用 于 界面 绘制 ， 首 先 确定 窗 体 的 大 小 ， 绘 制 背景 
F 线 程 中 进行 绘制 。 


出 
于 
此 
油 
也 
如 
清 
地 
蔷 | 
洋 
泪 
局 
益 
半 
浇 


22.3.2 ”消息 相应 事件 RS 


作 、 


具体 代码 如 下 。 


import pygame 
import sys 
# 全 局 初始 化 
PYgame .init() 
# 设 置 窗口 的 分 辩 率 和 标题 
resolution = width,height = 480,700 4 设置 窗口 大 小 和 标题 
windowsurface = pygame.display.set_mode (resolution) # 设 置 分 辩 率 并 得 到 全 局 的 绘图 表面 
pygame .display.set_caption ("飞机 大 战 ") #4 设置 标题 
# 加 载 背 景 图 ,返回 的 表面 可 以 用 于 绘制 其 他 对 象 于 其 上 
bgsurface = pygame.image.load("./images/background.png") .convert () 
+# 创 建 时 钟 对 象 
clock = pygame.time.Clock() 
if name ==' main _'; 
# 开 启 消息 循环 
while True: 
+# 处 理 用 户 输入 
for event in pygame.event.get(): 
# 处 理 退 出 事件 
if event .type == pygame.QUIT: 
pygame .quit () 
SYS .exit () 

# 将 背景 图 像 绘制 于 窗口 表面 windowSurface 

windowsurface.blit (bgsurface, (0, 0)) 

#4 绘制 结束 ,刷新 界面 

pygame.display.flip() 

+# 时 钟 停留 一 帧 的 时 长 

clock.tick(60) 


部 
消息 处 理 主要 用 于 线程 控制 ， 不 同 线程 运行 使 用 消息 机 制 进行 同步 ， 例 如 背景 动画 效果 、 鼠 标 键盘 操 
角色 移动 等 。 

具体 代码 如 下 。 


import pygame 
import sys 
站 全 局 初始 化 
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22.3.3 ”角色 绘制 与 操控 


角色 绘制 主要 涉及 角色 飞机 动态 效果 ， 多 张 图 片 交 蔡 绘制 是 在 线程 中 完成 的 。 
具体 代码 如 下 。 


/FN 
ns ( 超 值 版 ) 
NE 


22.3.4 声音 处 理 


声音 处 理 涉及 背景 音效 、 子 弹 发 出 的 声音 、 敌 机 被 击 中 爆炸 的 声音 ， 因 此 先 考虑 如 何 引 入 音效 。 
具体 代码 如 下 。 
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22.3.5 “僚机 处 理 


僚机 的 作用 主要 是 用 于 预 判 ， 例 如 与 敌 机 碰撞 ， 或 者 敌 机 子弹 碰撞 ， 可 以 通过 复制 当前 角色 至 预 判 位 
置 ， 如 果 发 生 碰撞 进行 处 理 。 
具体 代码 如 下 。 


Penamaam ( 超 值 版) 
NS 
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22.3.6 ”绘制 文本 


绘制 文本 主要 用 于 在 游戏 中 动态 显示 分 数 ， 获 取 文本 并 将 对 应 文本 转换 成 图 片 形式 进行 绘制 。 
具体 代码 如 下 。 


/FN 
超 值 版 
NE } 


22.3.7 ”增加 敌 机 


增加 敌 机 绘制 ， 敌 机 应 在 随机 位 置 出 现 ， 屏 幕 中 敌 机 数量 应 有 所 限制 ， 敌 机 出 现 后 做 机 械 和 运动 。 
具体 代码 如 下 。 


第 贺 章 “游戏 开发 飞机 大 战 


22.3.8 射击 处 理 


角色 发 送 子弹 处 理 ， 子 弹 发 出 位 置 应 为 角色 机 头 部 分 ， 子 弹出 现 后 同 敌 机 类 似 执行 机 械 性 动作 ， 从 角 
色 位 置 向 屏幕 上 方 移动 。 
具体 代码 如 下 。 
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22.3.9 ”爆炸 效果 


当 敌 机 被 角色 子弹 击 中 后 应 产生 爆炸 效果 ， 这 里 需要 处 理 两 个 地 方 ， 第 一 爆炸 效果 的 绘制 ， 第 二 发 生 
撞 后 的 音效 。 
具体 代码 如 下 。 
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b.move() 
# 绘 制 文字 
textSurface = textFont.render("Score:000", True, (255, 255, 255)) 
windowSurface.blit (textsurface, (10, 10)) 
#4 子弹 - 敌 机 碰撞 检测 
for b in bList: 
if b.isAlive: 
hitEnemyList = pygame.sprite.spritecollide(b, seGroup, False, pygame.sprite. 
collide mask) 
if len(hitEnemyList) > 0: 
b.isAlive = False 
for se in hitEnemyList: 
Se.isAlive = False 


22.3.10 ”分 数 处 理 


这 个 比较 简单 ， 当 有 敌 机 被 击 中 后 ， 根 据 敌 机 分 数 进 行 累加 ， 将 累加 后 的 结果 绘制 到 分 数 区 域 ， 实 现 
动态 累加 效果 。 

具体 代码 如 下 。 

# 绘 制 文字 


textSurface = textFont.render ("score:%d" % (score), True, (255, 255, 255)) 
windowSsurface.blit (textsurface, (10, 10)) 
+ 精灵 碰撞 检测 
for b in bList: 
if b.isRlive: 
hitEnemyList = pygame.sprite.spritecollide (b, seGroup, False, pygame.sprite.collide mask) 
if len(hitEnemyList) > 0: 
b.isAlive = False 
for se in hitEnemyList: 
se.isAlive = False 


score += 100 +# 打 死 一 个 敌人 加 100 分 


4 用 新 界面 
22.3.11 ”游戏 最 终 逻 辑 


通过 以 上 步骤 ， 最 终 会 完成 这 款 飞 机 大 战 游戏 ， 这 部 分 是 整体 游戏 逻辑 代码 ， 其 中 包括 界面 绘制 ， 角 
色 、 敌 机 、 子 弹 绘制 ， 以 及 按钮 被 单 击 后 的 游戏 暂停 与 开始 。 
具体 代码 如 下 。 


import pygame 

import sys 

from Bullet import Bullet 
from Button import PauseButton 
from Enemy import smallEnemy 
from Hero import Hero 

# 全 局 初始 化 

pygame .init() 

pygame .mixer.init() 


# 设 置 窗口 大 小 和 标题 
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p() 


游戏 运行 后 的 效果 如 图 22-2 所 示 。 


图 22-2 运行 效果 
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第 23 章 
网 上 购物 系统 


> 学 习 指引 


本 章 将 通过 Python 结合 Django 开发 一 套 网 络 购物 系统 ， 通 过 网 络 购物 项 目 熟 悉 Django 网 络 开发 。 


二 ”重点 导读 


*。 了 解 项 目的 开发 背景 。 
“掌握 用 户 系统 的 制作 方法 。 

* 掌握 购物 车 系统 的 制作 方法 。 
“掌握 商品 系统 的 制作 方法 。 

*。 掌 握 指令 系统 的 制作 方法 。 


23.1 开发 背景 


目前 网 络 购物 已 经 不 是 什么 新 鲜 事物 ， 当 人 们 的 生 
活水 平 不 断 提 高 ， 网 上 购物 不 断 成 熟 ， 这 便 催生 了 购物 
类 网 站 的 开发 ， 因 此 掌握 购物 类 网 站 的 设计 开发 对 于 日 
后 工作 学 习 都 会 有 非常 大 的 帮助 。 


23.2 系统 功能 


系统 功能 设计 如 图 23-1 所 示 。 图 23-1 系统 功能 图 


23.3 用户 系统 


日 户 系统 提供 用 户 的 注册 登录 ， 记 录用 户 详细 信息 、 用 户 操作 指令 、 用 户 选 择 商 品 加 入 购物 车 操作 等 。 


FN 
Python 从 入 门 到 项 目 实践 ( 超 值 版 ) 


23.3.1 用户 信 息 数 据 


用 户 信息 数据 需 建立 数据 库 表 ， 数 据 库 表 位 于 df_user 文件 夹 下 的 models.py 文件 中 。 用 户 信息 包括 用 
户 姓名 、 用 户 密码 、 用 户 邮 件 、 用 户 地 址 信息 、 电 话 信 息 等 。 
具体 代码 如 下 。 


class User (models.Model): 
uname = models.CharField (max length=20) 
upwd = models.CharField (max length=40) 
uemil = models.CharField (max length=30) 
urelname =models.CharField(max length=20,default="'') 
uadr = models.CharField (max length=100, default="'"') 
uphone = models.CharField (max _ length=11,default="'') 


23.3.2 用户 处 理 函 数 


用 户 处 理 函 数 协 助 用 户 操作 的 各 种 逻辑 处 理 , 位 于 df_user 文件 夹 下 的 views.py 文件 中 , 视图 处 理 函 数 
主要 用 于 处 理 用 户 登录 判断 、 密 码 加 密 、 登 录 后 Cookie 信息 的 保存 ， 以 便于 页 面 之 间 的 跳 转 。 

具体 代码 如 下 。 
def register (request): 

return render(request, 'df user/register.html') 
def register handle (request) : 

4# 接 收 用 户 输入 

post = request.POST 

uname = post.get('user name') 

pwd = post.get ('pwd') 

cpwd = post.get('cpwd') 

uemail = post.get ('email') 

#allow = post.get ('allow') 

+ 判断 密码 是 否 相等 

if pwd != cpwd: 

return redirect('/user/register') 

# 密 码 加 密 

# 使 用 shal 加 密 

s1 = shal() 

+#shal 加 密 前 ,要 先 编码 为 比特 

sl.update(pwd.encode('utf8') ) 

pwd = 51.hexdigest() 

# 存 入 数据 库 


user = User() 


user.uname = uname 
user.upwd = pwd 
user.uemil = uemail 
user.save() 
print (user.uname) 
return redirect('/user/login') 
def register exist (request): 
uname = request.GET.get('uname') # 通 过 url 传 参 的 方式 
count = User.objects.filter(uname=uname) .count () 
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return redirect('/') 
euser_decorator.login 
def user center info(request): 

username = request.session.get ('username') 


user = User.objects.filter (uname=username) .first () 


# 获 取 最 近 浏览 的 商品 
goodids = request.COOKIES.get ('goodids','') +# 获 得 cookie 存 的 记录 
if goodids != 1"': 

goodidsl = goodids.split( # 拆 分 为 列表 


# 这 样 查询 可 以 得 到 所 需 商 品 , 但 顺序 无 法 维护 , 无 法 为 原先 设 定 顺序 
#GoodInfo.objects.filter(id in=goodids) 
goods list = []# 用 来 存放 商品 列表 , 并 维持 顺序 不 变 
for good id in goodidsl: 
goods = GoodInfo.objects.filter (pk=good id) .first() 
goods list.append(goods) 
else: 
goods list = [] 
context = {'title': ' 用 户 中 心 '，'username': username, 'phone': user.uphone, 'adress': user.uadr, 
'good list':goods list,'tag':1} 
return render(request, 'df user/user center info.html', context) 
def user center site(request): 
username = request.session.get ('username') 
user = User.objects.filter (uname=username) .first () 
if request.method == 'POST': 
adr = request.POST.get ('area') 
username = request.POST.get ('user') 
phone = request.POST.get ('phone') 
user.uadr = adr 
user.uphone =phone 
user.urelname = username 
user.save() 
context = {'adr':user.uadr, 
"user':user.urelnamey 
"phone' :user .uphone, 
‘tag':3} 
return render (request, 'df_user/user center site.html',context) 
def user center order (request,pindex): 
uid = request.session.get ('uid') 
+ 根据 用 户 获得 所 有 订单 
orders = Order.objects.filter(user_id=int(uid)) .order by('-odate') 
paginator = Paginator (orders,2) 
page = paginator.page (int (pindex)) 
context = {'tag':2, 
'page' :page, 
"paginator' :paginator} 
return render(request, 'df user/user center order.html',context) 


23.3.3 用户 登 录 页 面 
静态 页 面 提供 用 户 的 各 种 操作 界面 ， 位 于 templates 文件 夹 下 的 df_user 文件 夹 下 。 用 户 登 录 页 面 是 一 
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个 独立 的 静态 页 面 ， 提 供用 于 登录 输入 的 两 个 编辑 框 以 及 记 住 密码 复 选 框 ， 如 果 初 次 登录 可 以 选择 注册 链 
接 跳 转 至 注册 页 面 。 
具体 代码 如 下 。 


用 户 登 录 页 面 如 图 23-2 所 示 。 
登录 之 前 需要 先进 行 注册 ， 用 户 注册 页 面 如 图 23-3 所 示 。 


AN 
hon 从 入 门 到 项 目 实践 ( 超 值 版 ) 
NO 


用 户 登 录 。@ 立 mt 


23-2 用 户 登 录 


用 户 注册 ga9 


十 广 


图 23-3 用 户 注册 


23.4 ”购物 车 系统 


用 户 与 商品 的 联系 是 多 对 多 的 ， 购 物 车 充当 中 间 环 节 ， 与 用 户 一 对 多 ， 同 时 与 商品 一 对 多 。 


23.4.1 购物 车 数据 


购物 车 数据 建 表 位 于 df cart 文件 夹 下 的 models.py 文件 中 ， 购 物 车 是 一 个 一 对 多 的 表 结构 ， 一 个 购物 
车 对 应 多 个 商品 ， 每 一 个 客户 应 该 有 一 个 独立 的 购物 车 ， 因 此 在 设计 购物 车 数据 表 时 需要 考虑 这 些 因素 。 
具体 代码 如 下 。 
class Cart (models.Model): 
User = models.ForeignKey ('df user.User') 
goods = models.ForeignKey('df goods.GoodInfo') 
count = models.IntegerField() 
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购物 车 处 理 函 数位 于 df cart 文件 夹 下 的 views.py 文件 中 ， 购 物 车 逻辑 涉及 购物 车 中 货物 的 计数 、 
展示 、 累 加 计算 等 操作 。 
具体 代码 如 下 。 


AN 
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页 面 


购物 车 静态 页 面 主要 用 于 向 用 户 展示 所 选 商品 ， 以 及 累计 商品 价格 ， 静 态 页 面 位 于 templates 文件 夹 下 
df cart 文件 夹 中 。 
具体 代码 如 下 。 
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</ul> 
{% endblock center body %} 


23.5 ”商品 系统 


商品 系统 主要 用 于 增加 、 修 改 、 删 除 、 展 示 物 品 ， 给 用 户 提供 商品 展示 供用 户 挑 选 ， 当 用 户 选中 商品 
时 可 以 进一步 展示 商品 详细 内 容 ， 需 购买 时 可 以 加 入 购物 车 。 


23.5.1 商品 数据 


商品 数据 位 于 df_ goods 文件 夹 下 的 models.py 文件 中 ， 商 品 数据 主要 用 于 展示 物品 信息 ， 其 中 包括 物 
品名 称 、 图 片 信息 、 物 品类 型 、 物 品 上 下 架 、 物 品 访问 量 、 简 介 、 详 情 、 库 存 等 信息 。 
具体 代码 如 下 。 
class TypeInfo (models.Model): 
ttitle = models.CharField (max length=20) 
isDelete = models.BooleanField (default=False) 
def _ str_ (self): 


return self.ttitle 
class GoodInfo (models.Model): 

gtitle = models.CharField (max length=50) 
gpic = models.ImageField (upload to='df goods') 
gprice = models.DecimalField (max digits=5, decimal places=2) 
isDelete = models.BooleanField (default=False) 
gunit = models.CharField (max_ length=20,default='500g') 
gclick = models.IntegerField() # 点 击 量 
gintro = models.CharField (max length=100) # 简 介 
gdetial = HTMLField() 
gtype = models.ForeignKey ("TypeInfo") 
gkucun = models.IntegerField (default=0) #4 库存 
#gadv = models.BooleanField(default=False) ”# 推 荐 广告 商品 
def _ str (self): 


return self.gtitle 


23.5.2 ”商品 处 理 函 数 


商品 处 理 函 数位 于 df_goods 文件 夹 下 的 views.py 文件 中 。 
具体 代码 如 下 。 


def index (request) : 
context = {'guest cart': 1, 
"title': ' 首 页 '} 


Dt 


# 获 得 最 火 的 4 个 商品 

hot = GoodInfo.objects.all() .order by('-gclick') [0:4] 
context .setdefault ('hot', hot) 

#4+*4* 获 得 各 分 类 下 的 单 击 商品 ***#######4 
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23.5.3 ”商品 列表 页 面 


商品 列表 页 面 用 于 展示 商品 信息 , 商品 操作 的 页 面 较 多 , 位 于 templates 文件 夹 下 的 df_goods 文件 夹 中 。 
由 于 商品 页 面 顶部 信息 与 底部 信息 多 数 相同 ， 因 此 这 里 采用 模板 继承 的 方式 处 理 ， 将 相同 部 分 单独 抽取 出 
来 作为 一 个 页 面 。 

具体 代码 如 下 。 


Panamaam ( 超 信 版 ) 
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</div> 
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网 上 购物 系统 


{% endblock center content %} 


a 


品 展示 页 面 ， 这 旦 


有 加 入 了 一 些 测试 数据 ， 如 图 23-4 所 示 。 


SD sem 
aas 


新 峡 水 果 1 


时 令 水 果 


委 避 后 纤夫 机 


BR 


Co 


单 击 某 一 商品 会 跳 转 到 单独 商品 详细 页 面 ， 如 图 23-5 所 示 。 


23-4 商品 展示 页 面 


oo 不 二 200 


| 


23-5 ”商品 详细 页 面 


23.6 ”指令 系统 


引 令 系统 主要 是 系统 内 部 运作 指令 ， 提 供 订单 编号 、 订 单 提交 时 间 、 商 品 结算 等 操作 。 
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“23.6.1 指令 数据 


指令 数据 位 于 df_order 文件 夹 下 的 models.py 文件 中 。 


十 


具体 代码 如 1 
class Order (models.Model): 
oid = models.CharField (max length=20,primary key=True) ## 订 单 号 
user = models.ForeignKey('df user.User') 
odate = models.DateTimeField (auto now=True) # 订 单 提交 时 间 


oispay = models.BooleanField (default=False) 
ototal = models.DecimalField (max digits=6,decimal places=2) ## 小 数 为 2 位 ,一 共 6 位 
oadress = models.CharField (max_length=150) 
class OrderDetail (models.Model): 
goods = models.ForeignKey('df goods.GoodInfo') 
order = models.ForeignKey (Order) 
Price = models.DecimalField(max digits=5,decimal places=2) 
count = models.IntegerField() 


23.6.2 ”指令 处 理 函 数 


指令 处 理 函 数位 于 df _order 文件 夹 下 的 views.py 文件 中 ， 涉 及 结算 操作 一 定 要 使 用 事物 ， 避 免 异常 导 
致 数据 丢失 。 
具体 代码 如 下 。 
@login 
def order (request): 
uid = request.session.get ('uid') 


user = User.objects.get (id = uid) # 获 得 用 户 对 象 信息 
cartids = request.GET.getlist('cart_id') 4 获取 多 个 同名 的 参数 
carts = [] # 取 出 对 应 的 所 有 cart 对 象 


totalprice = 0 
for cid in cartids: 
cart = Cart.objects.get (id=cid) 
carts.append (cart) 
totalprice = totalprice + float(cart.count) * float(cart.goods.gprice) 
totalprice = float('%0.2f'%totalprice) 
context = {'user':user, 
'carts':carts, 
'total price':totalprice} 
return render(request, 'df _ order/place order.html',context) 
这 些 步骤 中 ， 任 何 一 个 环节 出 错 都 不 允许 ， 要 使 用 事务 提交 。 
(1) 创建 订单 对 象 ; 
(2) 判断 商品 库存 充足 ; 
(3) 创建 、 订 单 、 订 单 详情 绑 定 ; 
(4) 修改 库存 ; 
(5) 删除 购物 车 。 


@transaction.atomic() 


elogin 
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23.6.3 ”指令 页 面 


指令 页 面 提供 用 户 邮寄 地 址 、 结 算 方式 等 操作 ， 位 于 templstes 文件 夹 中 的 df_order 文件 夹 中 。 
具体 代码 如 下 。 


Pa) namaam ( 超 信 版 ) 
SN 


Pnon ATI (im) 


| 见 职位 撕 述 与 分 析 


首席 执行 官 (CEO ) 


EEC 
首席 财务 官 (CFO ) 


首席 技术 官 (CTO ) 
首席 信 | 


(clo) 


软件 开发 魔 典 


通过 亲手 实践 项 目 来 掌握 编程 


ti WO 刘 


SQL Server 


ET 
idosenefte SS WN 


图 书 查 询 1 展 阅读 


P 


ython 


从 入 门 到 项 目 实践 ( 超 值 版 ) 


， 把 真正 的 


清华 社 官方 微 信号 
pred 


编程 变 得 简单 


ES 


7-302-! 


IN 978- 53469-; 


